T0 大厂 阿里巴巴 实习 二面
阿里巴巴 云 AI Infra 实习 二面 (1)
阿里巴巴 AI Infra 实习二面面试真题,涵盖推理优化、算子优化、高性能计算等方向
推理优化 算子优化 高性能计算
项目经历
- 介绍你在算子优化、算子融合与图优化、稳定性问题修复方面的工作经历。
- 在推理或训练过程中遇到显存异常与长期稳定性问题时,如何定位与排查?请结合具体案例说明。
- 从工程角度出发,如何对一个算子进行性能优化?请以具体示例说明优化思路、收益评估及极限分析。
- 量化推理(如 AWQ 路线下的 W4A16)在具体实现上涉及哪些关键环节?包括 Linear 层改造、数据结构设计、内存布局处理、正确性验证等。
基础知识
- 多卡协同场景下,卡间通信有哪些方式?NVLink 和 RDMA 各自的特点是什么?
- 不同 GPU 生态之间存在哪些主要差异?
- 算子优化的效果如何传导到整网层面?整网之外又如何与多卡互联、Profiling、软硬件协同等环节衔接?
- 如何看待使用 AI Agent 辅助代码编写、Review 及工程梳理?