跳到主要内容
T1 大厂/独角兽 快手 实习

快手 AI Infra 实习

快手 AI Infra 实习面试真题,涵盖推理优化、算子优化等方向

推理优化 算子优化

基础知识

  1. 除项目中使用的量化方案外,还了解哪些其他量化方法?
  2. 从量化误差的角度来看,数据分布应满足什么条件较为理想?
  3. 对于存在异常值的情况,数据分布越均匀量化效果通常越好。在量化到 INT8、FP8、INT4 时均成立,但量化到 FP4 时为何不再适用?
  4. 请描述 CUDA GEMM 的优化方法,以及计算过程中 Shared Memory 大小的选取策略。

项目经历

  1. 介绍实习期间的主要工作内容。
  2. 详细介绍项目的技术方案与实现。

编程题

  1. 使用 CUDA 编写一个 Norm 算子。输入:x[N],输出:norm = (x - u) / o,其中 u = mean(x[N]),o = sqrt(sum((x - u)^2) / N)。