网站地图官方微信:
网站首页 水寨镇 石堤镇 松口镇 福德镇 康卓乡 多却乡

当前位置: 首页 >

为什么我还是无法理解transformer?

不要想的太过复杂,就只有随机数生成的三个矩阵,原始输入已经通过矩阵相乘关联在三个随机数矩阵中,再通过一些代数游戏得到每个token对于整体输入序列的注意力权重矩阵,再和另外一个随机数矩阵进行线性的代数变化即可。

反向传播更新的是这三个矩阵的权重,三个矩阵的维度设计也是为了符合线性代数的运算。

总之这个就是一个巧妙的线性代数游戏,没有什么复杂的逻辑问题。

为什么我还是无法理解transformer?

  • | 可以随身携带一个Linux系统吗? |

    别说一个Linux系统,我一个移动硬盘里装了ventoy+上...

    查看详情>>
  • | 电视剧《天道》的作者到底懂不懂音响呢?它暗喻了哪些音响品牌呢? |

  • | 为什么 macOS 并不差,可市场总敌不过 Windows? |

  • | 为什么面对 Adobe 的版权要求下,vposy 大神还能从容不迫? |

  • | 自己拥有一台服务器可以做哪些很酷的事情? |

  • | 谁是对Mac有成见然后用完Mac后真香的? |

  • | 你最满意的10款 PC 软件是什么? |

  • | 程序员男朋友都是怎样的? |

  • | MongoDB的缺点以及你为什么不使用MongoDB? |

  • | 能分享一下你写过的rust项目吗? |

  • | 熊猫烧香技术含量高吗?高在哪里? |

  • 有一个很新的东西,叫做tls指纹,服务器可以根据这个判断是否...

    2025-06-24
  • 微软周一宣布,将在欧洲停止目前Microsoft Edge的...

    2025-06-24
  • 普通用户很难看出来的。 利益相关,我业余工作就是制作散片cp...

    2025-06-24
  • 不会是湖南交通工程学院的吧,答辩现场老师当场反驳了一个学生j...

    2025-06-24

关注我们

添加微信好友,关注最新动态