跳到主要内容
T5 其他 科大讯飞 校招

科大讯飞 飞星 AI Infra 校招

科大讯飞 AI Infra 校招面试真题,涵盖推理优化等方向

推理优化

推理优化

  1. NVIDIA GPU 对 FP8 数据类型有哪些专门的硬件优化?
  2. FP8 的两种格式(E4M3 与 E5M2)有什么区别?各自的计算方式是什么?
  3. 如何计算使用 FP8 存储时的 KV Cache 大小?
  4. H 系列与 L 系列 GPU 在架构设计上有哪些不同?
  5. 近期推理优化领域有哪些值得关注的新技术或新方法?