T1 大厂/独角兽 快手 实习 一面
快手 AI Infra 实习 一面 (1)
快手 AI Infra 实习一面面试真题,涵盖推理优化、算子优化等方向
推理优化 算子优化
推理优化
- 请介绍模型量化与 FlashAttention 的原理,实际使用中优化效果如何?
- TensorRT 的底层加速原理是什么?
- 是否了解 vLLM 框架?PagedAttention 的设计思想是什么?
- Qwen 模型部署时占用多少显存?在实习中采用了怎样的部署方案?
基础知识
- PyTorch 的核心基础功能有哪些?是否使用过 PyTorch 进行 GPU 资源管理?
- 模型训练与推理在资源消耗方面有哪些区别?训练过程中有哪些性能优化手段?
- GPU 与 CUDA 的基本概念是什么?GPU 最基础的物理执行单元是什么?
项目经历
- 介绍实验室项目,说明模型的参数量与计算量是如何计算的。
- 实习内容介绍,对所从事岗位的理解。
编程题
- 将有序数组转换为平衡二叉搜索树。