跳到主要内容
T0 大厂 阿里巴巴 实习 二面

阿里巴巴 云 AI Infra 实习 二面 (1)

阿里巴巴 AI Infra 实习二面面试真题,涵盖推理优化、算子优化、高性能计算等方向

推理优化 算子优化 高性能计算

项目经历

  1. 介绍你在算子优化、算子融合与图优化、稳定性问题修复方面的工作经历。
  2. 在推理或训练过程中遇到显存异常与长期稳定性问题时,如何定位与排查?请结合具体案例说明。
  3. 从工程角度出发,如何对一个算子进行性能优化?请以具体示例说明优化思路、收益评估及极限分析。
  4. 量化推理(如 AWQ 路线下的 W4A16)在具体实现上涉及哪些关键环节?包括 Linear 层改造、数据结构设计、内存布局处理、正确性验证等。

基础知识

  1. 多卡协同场景下,卡间通信有哪些方式?NVLink 和 RDMA 各自的特点是什么?
  2. 不同 GPU 生态之间存在哪些主要差异?
  3. 算子优化的效果如何传导到整网层面?整网之外又如何与多卡互联、Profiling、软硬件协同等环节衔接?
  4. 如何看待使用 AI Agent 辅助代码编写、Review 及工程梳理?