跳到主要内容
T1 大厂/独角兽 美团 一面

美团 AI Infra 一面

美团 AI Infra 一面面试真题,涵盖推理优化、算子优化等方向

推理优化 算子优化

以下为美团 AI Infra 一面及二面考察内容整理。

项目经历

  1. 针对简历中涉及的全部项目进行深入提问,重点考察项目细节与技术实现

基础知识

  1. Decoder-only 架构与 Encoder-only 架构各自的优势与不足
  2. 概述 LLaMA 模型的主要设计特点
  3. CUDA 编程模型的基本概念与层次结构
  4. CUDA 内存模型包含哪些层级,各自的特点是什么
  5. 使用共享内存时如何应对 bank conflict,有哪些规避策略
  6. 使用寄存器时可能遇到哪些问题(如寄存器溢出),应如何处理
  7. GPU 多线程与 CPU 多线程在调度机制上有何本质差异
  8. 阐述 Flash Attention 的核心原理
  9. 阐述 Paged Attention 的设计思路与工作机制