T0 大厂 字节跳动 实习 二面 2026年4月17日 字节跳动 豆包 AI Infra 实习 二面 字节跳动 AI Infra 实习二面面试真题,涵盖推理优化、训练优化等方向 推理优化 训练优化 基础知识 Decoder-only 架构为什么成为当前大模型的主流选择? Qwen2 的模型结构是怎样的?相较于 Qwen1 做了哪些改进? PPO 与 DPO 的核心思想分别是什么? 为什么在 SFT 之后仍然需要 RLHF 阶段? 推理优化 目前有哪些常见的模型训练与推理优化方法? 项目经历 请介绍你的实习项目及论文研究内容。 编程题 合并 K 个升序链表(LeetCode 23)。 上一篇 字节跳动 抖音电商 AI Infra 下一篇 华为 AI Infra (2)