跳到主要内容
T0 大厂 阿里巴巴 一面

阿里巴巴 AI Infra 一面 (2)

阿里巴巴 AI Infra 一面面试真题,涵盖高性能计算等方向

高性能计算

基础知识

  1. 描述 Qwen-VL 的完整训练流程。
  2. 多模态大模型中,将视觉特征传递给 LLM 有哪些常见方法?
  3. ViT 通常采用什么方式进行预训练?
  4. 针对不同尺寸的图片或视频输入,位置编码应如何设计?
  5. ResNet 或 Transformer 中残差连接的作用是什么?请展开分析。
  6. 介绍多模态 RAG 的基本思路与实现方案。

项目经历

  1. 进行自我介绍并详细说明项目经历。
  2. 概述大模型的训练流程。

开放题

  1. 大模型在训练和推理过程中显存不足时,有哪些优化方案?

编程题

  1. 数组中的第 K 个最大元素(LeetCode 215)。