跳到主要内容
T0 大厂 腾讯 校招 一二面

腾讯 AI Infra 校招 一二面1

腾讯 AI Infra 校招一二面面试真题,涵盖算子优化等方向

算子优化

一面

推理优化

  1. 比较 TensorRT-LLM、AGI 与 vLLM 的源码实现差异
  2. continuous batching 的设计动机是什么
  3. 介绍 fastllm.cpp 的源码结构与实现思路

基础知识

  1. Python 中计算密集型任务应使用多进程还是多线程
  2. C++ 中继承的底层实现机制
  3. YOLO 模型推理加速的常见方法

编程题

  1. 最大子数组和

二面

推理优化

  1. 介绍 vLLM 与 PagedAttention 的核心原理
  2. 使用 Triton 实现 PagedAttention 的思路

基础知识

  1. CUDA 内存模型的层次结构与特点
  2. C++ 编译期运行的实现方式(constexpr 等)

编程题

  1. 计算一个整数的二进制表示中 1 的个数