跳到主要内容
T0 大厂 百度 实习 一面

百度 AI Infra 实习 一面 (1)

百度 AI Infra 实习一面面试真题,涵盖推理优化、算子优化、高性能计算等方向

推理优化 算子优化 高性能计算

大模型推理

  1. FlashAttention 的核心原理及其数学推导过程
  2. FusedAttention 的优化策略有哪些?
  3. RMSNorm 相比 LayerNorm 性能提升的原因是什么?
  4. Llama 模型中包含多少个全连接层?
  5. 描述 Llama2 的推理流程,每一层包含哪些算子?
  6. 设计一种比 cudaMalloc 更灵活高效的显存分配方案(cudaAllocator)

C++ 基础

  1. C++11 引入了哪些重要新特性?
  2. 智能指针的分类及各自特点
  3. unique_ptr 如何保证所有权的唯一性?
  4. shared_ptr 的引用计数归零后何时触发析构?
  5. 类的成员函数是否可以定义为模板函数?
  6. 左值与右值的定义及区别

CUDA 编程

  1. CUDA 提供了哪几种编程模型或方式?
  2. Tensor Core 与 CUDA Core 的功能差异

编程题

  1. 最长连续序列(LeetCode 128)
  2. 至多包含 K 个不同字符的最长子串(LeetCode 340)