网站地图官方微信:
网站首页 滨江区 酒店乡 育溪镇 白羊镇 二圣镇 打尖乡

当前位置: 首页 >

写CUDA到底难在哪?

对GPU进行性能优化时,cudagraph是绕不开的话题。

不仅是GPU,大部分的xpu都会提供类似graph mode的优化,相比于每次分别由CPU进行kernel launch的eager mode,graph mode通常都会有较大性能提升,然而也经常容易出现各种各样的奇怪问题。

NVIDIA有一个简单的 博客 介绍,其中只使用了stream capture的形式来构造cudagraph,而且本质上就是多个kernel前后提交,根本无法展示cudagraph的复杂性。

本文尝试从底层原理出发,根据文档 和 …。

写CUDA到底难在哪?

  • | 不用CDN就没事,用阿里云CDN就被攻击刷流量,阿里云表示证明不了就要用户买单,如何看到这种行为? |

    楼上 @佚明 已经讲得很好了,起因是三大运营商对PCDN打击...

    查看详情>>
  • | 如何看待不超过1879元的Mac mini(M4+16/256GB+票),易用性吊打同级其他台式电脑? |

  • | 如何看待Ollama基于Go语言开发而不是别的编程语言? |

  • | 为什么有的女生喜欢穿紧身牛仔裤? |

  • | 新手养鱼,鱼缸中能放入哪些水草? |

  • | 如何看待rust编写的zed编辑器? |

  • | 你都见过什么样的电脑盲? |

  • | 韦东奕(北大韦神)要是去写游戏引擎代码,能不能把虚幻引擎按在地上摩擦?数学好真能‘降维打击吗? |

  • | 如何评价网传鸿蒙 PC 成功裸机启动 Windows ARM? |

  • | 网络小白如何建立一个网站,供别人下载文件(主要是PDF和MP3)? |

  • | 各位前端大触们,一般怎么定颜色的? |

  • 我用手机写,软件用obsidian。 手机写方便。 随时随...

    2025-06-25
  • 因为提这个问题的肯定年纪比较小。 漏点这种问题即便在中国一...

    2025-06-25
  • 零几年的时候,暑***到南方打暑***工,图新鲜找个事干干。...

    2025-06-25
  • 装了飞牛 OS,安装了多个 Web 应用,比如个人博客、Gi...

    2025-06-25

关注我们

添加微信好友,关注最新动态