跳到主要内容
T4 车企/自驾 理想汽车 一面

理想汽车 AI Infra 一面

理想汽车 AI Infra 一面面试真题,涵盖算子优化等方向

算子优化

本轮以项目深入讨论为主,无基础知识考察。

项目经历

  1. 投机解码(Speculative Decoding)的原理是什么?大模型与小模型如何选择搭配?是否进行过微调?
  2. CUDA 算子做了哪些层面的优化?
  3. 项目中 Dense 模型与 MoE 模型在推理实现上有哪些差异?Expert Parallelism(EP)是如何实现的?
  4. 在实验室主要从事什么方向的研究工作?

编程题

  1. 现场出题(基础难度)。