跳到主要内容
T3 芯片/硬件 英伟达

英伟达 AI Infra

英伟达 AI Infra 面试真题,涵盖算子优化等方向

算子优化

项目经历

  1. 介绍在 GPU 或并行计算领域的项目经验。
  2. 优化 CUDA Kernel 时通常从哪些方面着手?
  3. 描述一次在资源受限的嵌入式环境中定位并解决性能瓶颈的经历。

编程题

  1. 给定时间字符串(如 “3:45”),计算时针与分针之间的最小夹角。
    • 追问:若需支持毫秒级精度,算法应如何调整?
  2. 设计多线程程序,使三个线程按顺序循环打印递增数字(线程 A 打印 1,线程 B 打印 2,线程 C 打印 3,线程 A 打印 4,依此类推)。
    • 追问:若某个线程异常退出,如何保证整个系统不会陷入死锁?