跳到主要内容
T1 大厂/独角兽 京东 校招 一面

京东 AI Infra 校招 一面

京东 AI Infra 校招一面面试真题,涵盖推理优化等方向

推理优化

推理优化

  1. 大模型推理优化有哪些常见方法?请从多个维度进行阐述。
  2. PagedAttention 的核心原理与设计思路是什么?
  3. FlashAttention 为什么能够实现加速?其计算过程是怎样的?
  4. PD 分离机制中,调度队列是如何实现的?
  5. Chunked Prefill 是指同一请求的 Prefill 和 Decode 交叉执行,还是不同请求之间的插入?

基础知识

  1. C++ 多态是如何实现的?
  2. 虚函数实现多态的具体机制是什么?虚函数表中的函数顺序是如何确定的?

项目经历

  1. 项目经历深入考察。

编程题

  1. 实现快速排序算法。