跳到主要内容
T1 大厂/独角兽 快手 实习 一面

快手 AI Infra 实习 一面 (1)

快手 AI Infra 实习一面面试真题,涵盖推理优化、算子优化等方向

推理优化 算子优化

推理优化

  1. 请介绍模型量化与 FlashAttention 的原理,实际使用中优化效果如何?
  2. TensorRT 的底层加速原理是什么?
  3. 是否了解 vLLM 框架?PagedAttention 的设计思想是什么?
  4. Qwen 模型部署时占用多少显存?在实习中采用了怎样的部署方案?

基础知识

  1. PyTorch 的核心基础功能有哪些?是否使用过 PyTorch 进行 GPU 资源管理?
  2. 模型训练与推理在资源消耗方面有哪些区别?训练过程中有哪些性能优化手段?
  3. GPU 与 CUDA 的基本概念是什么?GPU 最基础的物理执行单元是什么?

项目经历

  1. 介绍实验室项目,说明模型的参数量与计算量是如何计算的。
  2. 实习内容介绍,对所从事岗位的理解。

编程题

  1. 将有序数组转换为平衡二叉搜索树。