T0 大厂字节跳动实习二面 2026年4月17日

字节跳动豆包 AI Infra 实习二面

字节跳动 AI Infra 实习二面面试真题，涵盖推理优化、训练优化等方向

推理优化训练优化

基础知识

Decoder-only 架构为什么成为当前大模型的主流选择？
Qwen2 的模型结构是怎样的？相较于 Qwen1 做了哪些改进？
PPO 与 DPO 的核心思想分别是什么？
为什么在 SFT 之后仍然需要 RLHF 阶段？

推理优化

目前有哪些常见的模型训练与推理优化方法？

项目经历

请介绍你的实习项目及论文研究内容。

编程题

合并 K 个升序链表（LeetCode 23）。