T1 大厂/独角兽 快手 实习
快手 AI Infra 实习
快手 AI Infra 实习面试真题,涵盖推理优化、算子优化等方向
推理优化 算子优化
基础知识
- 除项目中使用的量化方案外,还了解哪些其他量化方法?
- 从量化误差的角度来看,数据分布应满足什么条件较为理想?
- 对于存在异常值的情况,数据分布越均匀量化效果通常越好。在量化到 INT8、FP8、INT4 时均成立,但量化到 FP4 时为何不再适用?
- 请描述 CUDA GEMM 的优化方法,以及计算过程中 Shared Memory 大小的选取策略。
项目经历
- 介绍实习期间的主要工作内容。
- 详细介绍项目的技术方案与实现。
编程题
- 使用 CUDA 编写一个 Norm 算子。输入:x[N],输出:norm = (x - u) / o,其中 u = mean(x[N]),o = sqrt(sum((x - u)^2) / N)。