T0 大厂 阿里巴巴 校招 一面
阿里巴巴 AI Infra 校招 一面
阿里巴巴 AI Infra 校招一面面试真题,涵盖推理优化等方向
推理优化
基础知识
- Transformer 相比 RNN 的核心优势是什么?Transformer 是否也存在 Scaling Law?
- KV-Cache 是在训练阶段还是推理阶段使用的?为什么训练阶段不使用 KV-Cache?
- Flash Attention 的核心思想是什么?它如何优化注意力计算?
- 除 Flash Attention 和 KV-Cache 外,还了解哪些注意力机制的优化方法?
- 是否了解生成式推荐?其基本思路是什么?
- SID 的训练流程是怎样的?
- Tiger 为何没有采用 Decoder-Only 的架构形式?
项目经历
- 介绍你的实习经历及主要工作内容。
- 介绍新闻推荐项目的整体方案与技术实现。
- 新闻推荐任务中正负样本是如何确定的?
编程题
- 接雨水问题(LeetCode 42)。