跳到主要内容
T0 大厂 阿里巴巴 二面

阿里巴巴 云 AI Infra 二面

阿里巴巴 AI Infra 二面面试真题,涵盖推理优化等方向

推理优化

基础知识

  1. 交叉熵损失函数的定义及其在分类任务中的作用是什么?
  2. 写出 Logistic 回归的公式,并说明其模型原理与损失函数。
  3. vLLM 中有哪些核心优化技术?请逐一说明。
  4. DeepSeek-MTP 是应用于训练阶段还是推理阶段?其具体工作流程是怎样的?
  5. 给定一个时间序列数据,如何通过机器学习方法进行建模以筛选重要特征,并在此基础上使用规则方法进行建模?

项目经历

  1. 介绍你负责的业务内容及技术方案。

开放题

  1. 基于现有大模型,如何结合 Agent 相关方法训练一个面向金融领域代码编写的 Coder 模型?