网站地图官方微信:
网站首页 葛溪乡 振文镇 集贤乡 柏溪镇 雄巴乡 尕海乡

当前位置: 首页 >

写CUDA到底难在哪?

对GPU进行性能优化时,cudagraph是绕不开的话题。

不仅是GPU,大部分的xpu都会提供类似graph mode的优化,相比于每次分别由CPU进行kernel launch的eager mode,graph mode通常都会有较大性能提升,然而也经常容易出现各种各样的奇怪问题。

NVIDIA有一个简单的 博客 介绍,其中只使用了stream capture的形式来构造cudagraph,而且本质上就是多个kernel前后提交,根本无法展示cudagraph的复杂性。

本文尝试从底层原理出发,根据文档 和 …。

写CUDA到底难在哪?

  • | 如何解决没有公网IP情况下对家里NAS的高速远程访问? |

    两个方案: 要么用 ipv6,因为2024 年了,公网 ip...

    查看详情>>
  • | 高并发下怎么做余额扣减? |

  • | golang和rust你选择哪个? |

  • | Rust的工程配置为何用toml格式? |

  • | YU7 之后的下一辆小米汽车可能是啥?小米会把所有车型做一遍吗? |

  • | 海贼王为什么现在被全网黑? |

  • | 「牛奶湖」游客排队接奶,当地表示可以放心喝,是否符合食品安全标准?此营销行为对当地牧业是否有宣传作用? |

  • | 《士兵突击》中如果高城动用关系,史今能不能留下来? |

  • | 大龄剩女到底要不要妥协结婚? |

  • | 为什么章若楠和杨超越长得很像,男人却更喜欢章若楠,认为有女人味,而觉得杨超越像小女孩? |

  • | 如何在不重装系统和软件的情况下换系统盘? |

  • 杭州警察之前还有一个上大分的操作,直接给网约车司机打电话,让...

    2025-06-28
  • 纯从消费者角度聊。 我不再相信 ARM 比 x86 有固有的...

    2025-06-28
  • 一个成语来总结,见微知著。 这是我用Kimi Resear...

    2025-06-28
  • 很多人都听说过 Switch 的大名,这是游戏史上最好玩的主...

    2025-06-28

关注我们

添加微信好友,关注最新动态