跳到主要内容
T0 大厂 阿里巴巴 校招 一面

阿里巴巴 AI Infra 校招 一面

阿里巴巴 AI Infra 校招一面面试真题,涵盖推理优化等方向

推理优化

基础知识

  1. Transformer 相比 RNN 的核心优势是什么?Transformer 是否也存在 Scaling Law?
  2. KV-Cache 是在训练阶段还是推理阶段使用的?为什么训练阶段不使用 KV-Cache?
  3. Flash Attention 的核心思想是什么?它如何优化注意力计算?
  4. 除 Flash Attention 和 KV-Cache 外,还了解哪些注意力机制的优化方法?
  5. 是否了解生成式推荐?其基本思路是什么?
  6. SID 的训练流程是怎样的?
  7. Tiger 为何没有采用 Decoder-Only 的架构形式?

项目经历

  1. 介绍你的实习经历及主要工作内容。
  2. 介绍新闻推荐项目的整体方案与技术实现。
  3. 新闻推荐任务中正负样本是如何确定的?

编程题

  1. 接雨水问题(LeetCode 42)。