T0 大厂 字节跳动 一二面 2026年4月17日 字节跳动 AML AI Infra 一二面 字节跳动 AI Infra 一二面面试真题,涵盖AI Infra等方向 一面 推理优化 大模型推理的主要性能瓶颈有哪些? 大模型推理有哪些核心优化技术? PagedAttention 的工作原理是什么? Orca 迭代级请求调度的设计思路是什么? 项目经历 请介绍你的项目经历(MPS、训练内存管理、调度策略、时分复用与空分复用等)。 编程题 实现链表反转。 二面 基础知识 C++ 中数组下标越界会导致什么错误? 在 Linux 环境下如何进行程序调试和错误定位? 项目经历 请介绍你的项目经历(MPS、GPU 利用率指标等)。 编程题 实现 LRU Cache。 上一篇 字节跳动 AI Infra 校招 一面 下一篇 字节跳动 抖音 AI Infra