T0 大厂 腾讯 校招 一二面
腾讯 AI Infra 校招 一二面1
腾讯 AI Infra 校招一二面面试真题,涵盖算子优化等方向
算子优化
一面
推理优化
- 比较 TensorRT-LLM、AGI 与 vLLM 的源码实现差异
- continuous batching 的设计动机是什么
- 介绍 fastllm.cpp 的源码结构与实现思路
基础知识
- Python 中计算密集型任务应使用多进程还是多线程
- C++ 中继承的底层实现机制
- YOLO 模型推理加速的常见方法
编程题
- 最大子数组和
二面
推理优化
- 介绍 vLLM 与 PagedAttention 的核心原理
- 使用 Triton 实现 PagedAttention 的思路
基础知识
- CUDA 内存模型的层次结构与特点
- C++ 编译期运行的实现方式(constexpr 等)
编程题
- 计算一个整数的二进制表示中 1 的个数