T0 大厂 阿里巴巴 一面 2026年4月17日 阿里巴巴 AI Infra 一面 (1) 阿里巴巴 AI Infra 一面面试真题,涵盖AI Infra等方向 基础知识 Group Query Attention 的设计动机与作用是什么? MoE 架构中,专家路由是针对每个 token 进行还是针对每个序列进行? 针对 KV Cache 有哪些常见的优化策略? RAG 系统中检索模块的实现方案有哪些? 预训练阶段常用的数据清洗方法有哪些? 项目经历 请阐述你设计的 Agent 系统的整体架构。 编程题 实现一个 LRU Cache。 上一篇 阿里巴巴 AI Infra (2) 下一篇 阿里巴巴 AI Infra 一面 (2)