T0 大厂 腾讯 实习 一面 2026年4月17日 腾讯 AI Infra 实习 一面 (2) 腾讯 AI Infra 实习一面面试真题,涵盖推理优化、高性能计算等方向 推理优化 高性能计算 项目经历 介绍实习期间的工作内容与项目经验,以及离职原因 推理优化 MoE 架构为何能在参数量极大的情况下控制训练和推理成本,其真正的技术难点在哪里 MoE 中的负载均衡通常采用哪些方法,为何部分模型 loss 表现正常但 expert 已经退化 GQA、MQA 与标准 MHA 的核心区别是什么,线上推理场景中为何更关注 GQA RoPE 位置编码的工作原理是什么,长上下文外推时为何容易出现失真 FlashAttention 的加速原理是什么,其优化的核心瓶颈是算力还是访存 上一篇 腾讯 AI Infra 实习 一面 (1) 下一篇 腾讯 AI Infra 校招 一二面1