T1 大厂/独角兽 网易 校招
网易 AI Infra 校招
网易 AI Infra 校招面试真题,涵盖推理优化、算子优化等方向
推理优化 算子优化
项目经历
- 详细描述简历中 AI 相关项目的主要模块与核心技术贡献
推理优化
- 设计高吞吐、低延迟的模型推理服务时,架构层面与工程层面需要重点考虑哪些问题
C++ 基础
- 阐述程序内存中栈、堆与静态/全局存储区的特点及区别
new/delete与malloc/free的主要差异是什么,C++ 中为何推荐使用前者- 深拷贝与浅拷贝的概念,以及何种场景下必须使用深拷贝
std::unique_ptr、std::shared_ptr和std::weak_ptr的设计意图、使用场景及区别- 虚函数表 (vtable) 如何实现运行时多态,虚函数与纯虚函数在语义和用法上有何不同
- 内存对齐的概念与编译器对结构体的对齐规则,计算给定结构体的
sizeof大小 - C++11 右值引用与移动语义的概念,以及如何用于实现高效的数据转移
CUDA 编程
- SIMT 编程模型的基本概念,thread、block、grid 的层次关系
- CUDA 内核中线程局部变量的存储位置及其与寄存器分配的关系
- 如何利用共享内存减少对全局内存的重复访问(以矩阵乘法分块为例)
- Warp shuffle 指令的概念及其在 warp 内数据交换与规约操作中的优势
- 向量化加载/存储指令(如 float4、int4)实现合并访存的原理与性能收益
- 共享内存 bank conflict 的产生原因及示例
- 通过数据填充 (padding) 或内存布局调整来避免 bank conflict 的方法
基础知识
- CPU 缓存的工作原理,包括时间局部性、空间局部性及常见的缓存替换策略
编程题
- 在大量整数的数据流中,实时找出出现频率最高的前 K 个元素(哈希表 + 最小堆),并分析时间复杂度