跳到主要内容
T3 芯片/硬件 中兴 二面

中兴 AI Infra 二面

中兴 AI Infra 二面面试真题,涵盖推理优化、训练优化、算子优化、高性能计算等方向

推理优化 训练优化 算子优化 高性能计算

项目经历

  1. 请逐一介绍你参与的主要项目,并阐述核心技术方案。

基础知识

  1. 分布式训练中,数据并行、模型并行和流水线并行分别是什么?各自适用于哪些场景?
  2. DeepSpeed 框架的核心功能及其优化策略有哪些?
  3. 给定一个模型的参数量,如何估算其训练过程中优化器状态、梯度和模型参数各自的显存占用?
  4. 若需在 16 张 GPU 上训练一个 200B 参数的模型,如何设计合理的分布式训练方案?
  5. 混合精度训练的原理和实现方式是什么?
  6. 大模型推理加速有哪些常用技术?
  7. KV Cache 的优化方法有哪些?
  8. 算子融合的原理及其对性能的影响是什么?
  9. Python 基础知识考察(数据结构、GIL、装饰器等)。
  10. Linux 常用命令考察。
  11. PyTorch 相关知识考察。