T5 其他 南湖研究院 一面
南湖研究院 AI Infra 一面
南湖研究院 AI Infra 一面面试真题,涵盖算子优化等方向
算子优化
以下为南湖研究院 AI Infra 一面考察内容。
C++/Python 基础
- Python 垃圾回收机制的实现原理
- Python 垃圾回收中如何处理循环引用(标记-清除算法)
- 函数内联在何种情况下会导致性能下降
inline关键字对作用域的影响- 除
inline外,还有哪些机制会触发内联(如模板函数) - 完美转发的概念与实现
- 右值引用的含义与应用场景
AI 框架与 CUDA
- FasterTransformer 框架的核心特性
- 常见 AI 推理/训练框架概述
- 线程同步的常用机制
- CUDA Stream 的使用要求(如设备端操作重叠)
- CUDA 算子性能优化的常用方法
工程实践
- Git 多人协作的工作流程
编程题
- 实现智能指针
- 求数组中前 K 大的元素