跳到主要内容
T5 其他 科大讯飞 校招

科大讯飞 AI Infra 校招

科大讯飞 AI Infra 校招面试真题,涵盖高性能计算等方向

高性能计算

基础知识

  1. FlashAttention 的核心优化点有哪些?分块加载 QKV、Online Softmax 以及显存复杂度从 O(N^2) 降至 O(N) 分别是如何实现的?
  2. Self-Attention 中为什么要对点积结果除以 sqrt(d)?不做缩放会导致什么问题?
  3. 回调函数的实现原理是什么?
  4. 显存越界问题的常见排查方法有哪些?

项目经历

  1. 项目经历深入考察。