网站地图官方微信:
网站首页 溪潭镇 查山乡 交梨乡 打隆镇 平堡乡 南义乡

当前位置: 首页 >

写CUDA到底难在哪?

对GPU进行性能优化时,cudagraph是绕不开的话题。

不仅是GPU,大部分的xpu都会提供类似graph mode的优化,相比于每次分别由CPU进行kernel launch的eager mode,graph mode通常都会有较大性能提升,然而也经常容易出现各种各样的奇怪问题。

NVIDIA有一个简单的 博客 介绍,其中只使用了stream capture的形式来构造cudagraph,而且本质上就是多个kernel前后提交,根本无法展示cudagraph的复杂性。

本文尝试从底层原理出发,根据文档 和 …。

写CUDA到底难在哪?

  • | LCD党真的只是少部分人吗? |

    本人高强度使用了四年LCD手机(vivo x6、iqoo n...

    查看详情>>
  • | 软路由怎么没有人玩了? |

  • | 一个练过功夫的姑娘能打过一个没练过的男人吗? |

  • | 北大「韦神」粉丝破 2000 万,评论区成高考许愿池,如何看待家长们纷纷从韦神这里「沾福气」的心理? |

  • | 如何看待“Hutool”工具类库广受欢迎? |

  • | 5 月 28 日 DeepSeek R1 模型完成小版本试升级并开源,具体有哪些提升?使用体验如何? |

  • | 印度为什么一定要和中国作对? |

  • | 新买了一台nas,第一个月下载20t+,上传5+,不会被网警盯上吧? |

  • | Rust 的设计缺陷是什么? |

  • | 巅峰期的成龙身体素质是怎么一种存在? |

  • | 家里想搞一个服务器,怎么才不违规? |

  • 因为其他人根本不用学。 举个例子,韩觉得自己傀儡术天赋很高...

    2025-06-22
  • 绝对不要exFAT!!!!绝对不要exFAT!!!!绝对不要...

    2025-06-23
  • 又到了新一年HDC,不知不觉HarmonyOS 6开发者be...

    2025-06-22
  • 在桌面应用开发的漫长历史中,我们见证了技术范式的演进:从 j...

    2025-06-22

关注我们

添加微信好友,关注最新动态