T2 AI 独角兽 智谱 实习 一面
智谱 AI Infra 实习 一面
智谱 AI Infra 实习一面面试真题,涵盖推理优化等方向
推理优化
基础知识
- 请阐述 per-tensor、per-channel、per-group 三种量化粒度的区别,哪种粒度最细?
- minmax 校准与 percentile 校准的核心差异是什么?
- 除 minmax 和 percentile 外,还有哪些常见的校准算法?请简述 KL 散度校准和 MSE 校准的基本原理。
- 请说明 SmoothQuant 的量化粒度及其工作原理,并与 AWQ、GPTQ 的作用流程进行对比。
- NV FP4 的量化原理是什么?缩放因子在哪个维度上计算?存储格式如何设计?
- 在实际部署中,常见的量化目标格式有哪些?请对比 FP8 与 NV FP4 的适用场景。
项目经历
- 请介绍你的实习项目经历。
编程题
- 请分别实现 minmax 校准和 percentile 校准算法。