跳到主要内容
T0 大厂 字节跳动 实习 二面

字节跳动 豆包 AI Infra 实习 二面

字节跳动 AI Infra 实习二面面试真题,涵盖推理优化、训练优化等方向

推理优化 训练优化

基础知识

  1. Decoder-only 架构为什么成为当前大模型的主流选择?
  2. Qwen2 的模型结构是怎样的?相较于 Qwen1 做了哪些改进?
  3. PPO 与 DPO 的核心思想分别是什么?
  4. 为什么在 SFT 之后仍然需要 RLHF 阶段?

推理优化

  1. 目前有哪些常见的模型训练与推理优化方法?

项目经历

  1. 请介绍你的实习项目及论文研究内容。

编程题

  1. 合并 K 个升序链表(LeetCode 23)。