T0 大厂 阿里巴巴 一面 2026年4月17日 阿里巴巴 AI Infra 一面 (2) 阿里巴巴 AI Infra 一面面试真题,涵盖高性能计算等方向 高性能计算 基础知识 描述 Qwen-VL 的完整训练流程。 多模态大模型中,将视觉特征传递给 LLM 有哪些常见方法? ViT 通常采用什么方式进行预训练? 针对不同尺寸的图片或视频输入,位置编码应如何设计? ResNet 或 Transformer 中残差连接的作用是什么?请展开分析。 介绍多模态 RAG 的基本思路与实现方案。 项目经历 进行自我介绍并详细说明项目经历。 概述大模型的训练流程。 开放题 大模型在训练和推理过程中显存不足时,有哪些优化方案? 编程题 数组中的第 K 个最大元素(LeetCode 215)。 上一篇 阿里巴巴 AI Infra 一面 (1) 下一篇 阿里巴巴 AI Infra 实习 (1)