T1 大厂/独角兽 美团 校招
美团 北斗 AI Infra 校招
美团 AI Infra 校招面试真题,涵盖推理优化、算子优化、高性能计算等方向
推理优化 算子优化 高性能计算
以下为美团北斗 AI Infra 校招面试考察内容。
基础知识
- 阐述 Transformer 的整体架构,与传统 RNN(循环神经网络)相比具备哪些优势
- Transformer 中参数主要分布在哪些模块?参数量最大的部分是什么?计算量最大的部分是什么,原因是什么
- 说明 GPU 中 CUDA Core 与 Tensor Core 的区别,列举常用 GPU 型号及其显存容量与显存带宽
- 介绍大模型量化的基本原理,并描述量化算子的实现方式
- 详细说明 Prefill-Decode 分离(PD 分离)的设计思路
- 详细说明 Paged Attention 的工作机制
编程题
- LeetCode 25:K 个一组翻转链表
- 编写 CUDA 算子:实现前缀和的基础版本,并阐述可行的优化方法
- 编写 CUDA 算子:实现 GEMM 的基础版本,并阐述可行的优化方法