T1 大厂/独角兽 快手 一面
快手 AI Infra 一面
快手 AI Infra 一面面试真题,涵盖推理优化、算子优化、高性能计算等方向
推理优化 算子优化 高性能计算
基础知识
- 是否了解 Prefill-Decode(PD)分离?AF 分离的目的是什么?既然已有 PD 分离,为何还需要 AF 分离?
- FlashAttention V2 相比 V1 做了哪些改进?具体优化思路是什么?是否了解最新的 V4 版本?
- 大模型中一层 Transformer 包含几个线性层?张量并行(TP)时如何切分?这样切分的原因是什么?有哪些思路可以优化中间的 AllReduce 操作?
- Ray 的底层实现机制是什么?有哪些关键特性?在实际研究中是如何使用 Ray 的?
- 列举并阐述 CUDA GEMM 的常见优化方法。
项目经历
- 详细介绍项目背景、技术方案和实现细节。
编程题
- LeetCode 单词接龙。