跳到主要内容
T1 大厂/独角兽 快手 实习 一面

快手 AI Infra 实习 一面 (2)

快手 AI Infra 实习一面面试真题,涵盖推理优化、算子优化等方向

推理优化 算子优化

基础知识

  1. vLLM 中的 PagedAttention 机制是什么?Chunked Prefill 的实现原理是怎样的?Continuous Batching 的概念及其作用是什么?

项目经历

  1. 推理框架中的算子优化具体采用了哪些方法?
  2. Memory Pool 的设计与构建思路是什么?
  3. 框架测试方案是如何设计的?测试数据规模有多大?

编程题

  1. 给定一个每行有序的二维数组,求其中第 K 小的元素。