跳到主要内容
T1 大厂/独角兽 网易 校招

网易 AI Infra 校招

网易 AI Infra 校招面试真题,涵盖推理优化、算子优化等方向

推理优化 算子优化

项目经历

  1. 详细描述简历中 AI 相关项目的主要模块与核心技术贡献

推理优化

  1. 设计高吞吐、低延迟的模型推理服务时,架构层面与工程层面需要重点考虑哪些问题

C++ 基础

  1. 阐述程序内存中栈、堆与静态/全局存储区的特点及区别
  2. new/deletemalloc/free 的主要差异是什么,C++ 中为何推荐使用前者
  3. 深拷贝与浅拷贝的概念,以及何种场景下必须使用深拷贝
  4. std::unique_ptrstd::shared_ptrstd::weak_ptr 的设计意图、使用场景及区别
  5. 虚函数表 (vtable) 如何实现运行时多态,虚函数与纯虚函数在语义和用法上有何不同
  6. 内存对齐的概念与编译器对结构体的对齐规则,计算给定结构体的 sizeof 大小
  7. C++11 右值引用与移动语义的概念,以及如何用于实现高效的数据转移

CUDA 编程

  1. SIMT 编程模型的基本概念,thread、block、grid 的层次关系
  2. CUDA 内核中线程局部变量的存储位置及其与寄存器分配的关系
  3. 如何利用共享内存减少对全局内存的重复访问(以矩阵乘法分块为例)
  4. Warp shuffle 指令的概念及其在 warp 内数据交换与规约操作中的优势
  5. 向量化加载/存储指令(如 float4、int4)实现合并访存的原理与性能收益
  6. 共享内存 bank conflict 的产生原因及示例
  7. 通过数据填充 (padding) 或内存布局调整来避免 bank conflict 的方法

基础知识

  1. CPU 缓存的工作原理,包括时间局部性、空间局部性及常见的缓存替换策略

编程题

  1. 在大量整数的数据流中,实时找出出现频率最高的前 K 个元素(哈希表 + 最小堆),并分析时间复杂度