T3 芯片/硬件 寒武纪 实习 2026年4月17日 寒武纪 AI Infra 实习 寒武纪 AI Infra 实习面试真题,涵盖算子优化等方向 算子优化 第一轮 算子优化 GEMM 中为什么通常让单个线程处理 8x8 的计算块? 使用 CUDA 实现算子时的主要难点有哪些? 是否使用 CUDA 实现过前缀和(prefix sum)? 什么是 bank conflict?有哪些减少 bank conflict 的方法? Little’s Law 中访存延迟与计算延迟的关系是什么? 项目经历 介绍参与的开源项目。 第二轮 主要沟通实习工作内容与安排。 上一篇 飞腾 AI Infra 校招 二面 下一篇 后摩智能 AI Infra 实习