T3 芯片/硬件 中兴 二面
中兴 AI Infra 二面
中兴 AI Infra 二面面试真题,涵盖推理优化、训练优化、算子优化、高性能计算等方向
推理优化 训练优化 算子优化 高性能计算
项目经历
- 请逐一介绍你参与的主要项目,并阐述核心技术方案。
基础知识
- 分布式训练中,数据并行、模型并行和流水线并行分别是什么?各自适用于哪些场景?
- DeepSpeed 框架的核心功能及其优化策略有哪些?
- 给定一个模型的参数量,如何估算其训练过程中优化器状态、梯度和模型参数各自的显存占用?
- 若需在 16 张 GPU 上训练一个 200B 参数的模型,如何设计合理的分布式训练方案?
- 混合精度训练的原理和实现方式是什么?
- 大模型推理加速有哪些常用技术?
- KV Cache 的优化方法有哪些?
- 算子融合的原理及其对性能的影响是什么?
- Python 基础知识考察(数据结构、GIL、装饰器等)。
- Linux 常用命令考察。
- PyTorch 相关知识考察。