设置

关灯

第623章 前世的终局与今生的起手(第3节)

是老实地点了点头。

“行了。还有,别叫顾总。”

“那叫什么?”

“随便,叫名字就行。”

任少卿没纠结这个问题。

他把电脑打开,插上U盘,解密后屏幕上出现了一份技术文档,图表密密麻麻。他转过屏幕朝向顾屿,手指点在一张折线图上。

“ImageNet验证集,TOp-5错误率,5.08%。五十层卷积神经网络。”

顾屿盯着那个数字看了三秒。

“人类标注员的平均水平是5.1%。”

任少卿的声音压得很低,但语速在加快,

“我们的模型精度已经追平了人类,甚至略微超过。核心突破点是一个我称之为'残差连接'的结构。简单来说,就是给深层网络开了一条捷径,让训练信号可以跳过中间层直接回传,解决了层数堆叠之后信号衰减的老大难问题。”

他翻到下一页,是不同层数网络的对比实验数据。

二十层、三十层、四十层、五十层,精度曲线一路攀升,没有出现以往深层网络必然遭遇的性能坍塌。

“以前整个学术界都默认,网络超过二十层就没法有效训练了。这个假设,被我们推翻了。”

顾屿靠在椅背上,目光停留在屏幕上那条稳步上升的曲线上。

他没说话。

不是因为震惊。而是因为他太清楚这个东西是什么了。

残差网络。ReSNet。

前世,这篇论文在2015年12月发表,第一作者正是任少卿。

它不仅横扫了当年所有计算机视觉的顶级竞赛,更从根本上改写了整个深度学习的工程范式。

从此以后,“网络可以无限加深”不再是空想,而是被数学和实验双重验证的事实。

它是后来所有大模型架构的地基之一。

没有残差连接,就没有后来的GPT,没有BERT,没有任

本章未完,请点击"下一页"继续阅读! 第3页 / 共6页