网站地图官方微信:
网站首页 太东乡 松湖镇 储潭镇 翁城镇 林滨镇 苟江镇

当前位置: 首页 >

写CUDA到底难在哪?

对GPU进行性能优化时,cudagraph是绕不开的话题。

不仅是GPU,大部分的xpu都会提供类似graph mode的优化,相比于每次分别由CPU进行kernel launch的eager mode,graph mode通常都会有较大性能提升,然而也经常容易出现各种各样的奇怪问题。

NVIDIA有一个简单的 博客 介绍,其中只使用了stream capture的形式来构造cudagraph,而且本质上就是多个kernel前后提交,根本无法展示cudagraph的复杂性。

本文尝试从底层原理出发,根据文档 和 …。

写CUDA到底难在哪?

  • | golang 与rust 在服务器程序领域相比较,各有什么优劣势? |

    Rust 高级,可维护性高,Golang 低级,写出来东西快...

    查看详情>>
  • | 鸿蒙折叠屏笔记本为什么敢卖26999? |

  • | 在所有动物肉中,哪一种味道最好? |

  • | 联想 128GB 超大内存迷你 AMD 主机上架,此款主机有哪些亮点? |

  • | 如何评价 Vue.js 纪录片? |

  • | 伊朗为什么不买中国战机,却坚持四十年用老旧的苏联米格29、美国F14雄猫战斗机? |

  • | 为什么感觉wps的用户越来越多,office没人用了? |

  • | 如何评价首个女性友好的编程语言HerCode? |

  • | 华为Pura 80首销遇冷,是否说明消费者已经开始对麒麟芯片性能有所觉醒? |

  • | 什么是 5G 固定无线接入(FWA)? |

  • | 如何看待国内服装尺码越来越小的现象? |

  • 前两年有个电影叫……皮囊之下 话说评分还是很高的,这里面...

    2025-06-22
  • 之前的文章《 Trae+Claude3.7 | 10分钟生成...

    2025-06-22
  • 有这样一个直播间,里面的主播们,个个不是明星却胜似明星,曾志...

    2025-06-22
  • 前段时间回国参加了一些活动,还跟一些国内做AI的朋友深入的聊...

    2025-06-22

关注我们

添加微信好友,关注最新动态