高二分科，我选校花也选亿万身家最新章节_黑狗不爱吃汤圆-第686章纯注意力机制？你们竟敢这么想(第1节)TXT全集下载-醉书楼手机阅读

文写的是用深度学习做推荐系统。”

“那正好。”楼天城喝了口咖啡。

“我们现在在做一个东西，需要你这个方向的人。”

他转身走向白板，拿起马克笔，刷刷刷写了一串公式。

林之远凑过去看。

那是一个注意力权重的数学表达式。

所谓“注意力机制”，通俗地说，就是让AI在处理一段信息时，能像人类阅读一样，自动把目光聚焦在最重要的部分，而不是平均分配精力。

但这个公式和他在论文里见过的不一样。

传统的注意力机制，是让AI在翻译时“回头看”原文。

比如翻译一句英文时，每写一个中文词，都回头看看英文原句里哪个词最相关。

而白板上这个公式，做的事情完全不同：它让一句话里的每个词，都去“看”这句话里的其他所有词。

不是回头看别人，是自己看自己。

“你们在做……序列内部的自相关计算？”

林之远的声音不自觉地提高了。

任少卿和楼天城对视了一眼。

“差不多。”任少卿说。

“我们在探索一种全新的方式来让AI理解语言。不依赖传统的循环结构。就是那种必须一个词一个词按顺序处理的老方法，而是完全用注意力机制，让所有词同时互相‘看见’彼此。”

林之远的脑子嗡了一下。

不依赖循环结构？纯注意力？

这个想法太疯狂了。当前全世界做语言AI的人，没有一个敢把循环网络完全扔掉。注意力机制在所有已发表的论文里，都只是辅助模块，从来不是主角。

“你们怎么敢往这个方向想？”

任少卿推了推眼镜，眼神里闪过敬畏：

“不是我们敢想，是老板问了我们一个问题。能不能让序列内部自己看自己。安德烈顺着这句话推导了三个月，才有了这套数学框架。

本章未完，请点击"下一页"继续阅读！第4页 / 共6页

高二分科，我选校花也选亿万身家全文阅读