T5 其他 科大讯飞 校招
科大讯飞 飞星 AI Infra 校招
科大讯飞 AI Infra 校招面试真题,涵盖推理优化等方向
推理优化
推理优化
- NVIDIA GPU 对 FP8 数据类型有哪些专门的硬件优化?
- FP8 的两种格式(E4M3 与 E5M2)有什么区别?各自的计算方式是什么?
- 如何计算使用 FP8 存储时的 KV Cache 大小?
- H 系列与 L 系列 GPU 在架构设计上有哪些不同?
- 近期推理优化领域有哪些值得关注的新技术或新方法?
科大讯飞 AI Infra 校招面试真题,涵盖推理优化等方向