January 1, 1·10 字·1 分钟 作者 Chuck Chan 分享技术、思考与生活 传统模型 # 上一篇文章中我们说过,相较于现今的大语言模型,传统的模型使用的是RNN循环神经网络 这种神经网络模式有几个缺点: 信息丢失 无法处理较长句子 不能并行计算 注意力机制 # 什么叫注意力机制?