跳过正文

·10 字·1 分钟
Chuck Chan
作者
Chuck Chan
分享技术、思考与生活

传统模型
#

上一篇文章中我们说过,相较于现今的大语言模型,传统的模型使用的是RNN循环神经网络

这种神经网络模式有几个缺点:

  1. 信息丢失
  2. 无法处理较长句子
  3. 不能并行计算

注意力机制
#

什么叫注意力机制?