跳到主要内容
T0 大厂 字节跳动 一二面

字节跳动 AML AI Infra 一二面

字节跳动 AI Infra 一二面面试真题,涵盖AI Infra等方向

一面

推理优化

  1. 大模型推理的主要性能瓶颈有哪些?
  2. 大模型推理有哪些核心优化技术?
  3. PagedAttention 的工作原理是什么?
  4. Orca 迭代级请求调度的设计思路是什么?

项目经历

  1. 请介绍你的项目经历(MPS、训练内存管理、调度策略、时分复用与空分复用等)。

编程题

  1. 实现链表反转。

二面

基础知识

  1. C++ 中数组下标越界会导致什么错误?
  2. 在 Linux 环境下如何进行程序调试和错误定位?

项目经历

  1. 请介绍你的项目经历(MPS、GPU 利用率指标等)。

编程题

  1. 实现 LRU Cache。