T4 车企/自驾 小马智行 实习 2026年4月17日 小马智行 AI Infra 实习 小马智行 AI Infra 实习面试真题,涵盖算子优化、高性能计算等方向 算子优化 高性能计算 基础知识 什么是 CUDA Graph?为何使用 CUDA Graph 会占用更多显存?推理过程中哪个阶段更适合使用 CUDA Graph? 阐述 NVIDIA GPU PTX 机器模型的核心概念。 描述 CUDA 代码的完整编译流程。 介绍 MLIR 框架的设计目标,为什么需要 MLIR? 高性能计算 说明跨 Block 的通信方式以及 Warp 级原语。列举常用的 Warp 原语并描述其功能。 编程题 实现归并排序算法。 上一篇 文远知行 AI Infra 校招 一面 下一篇 小鹏汽车 AI Infra