设置

关灯

第660章 读不出的中国名字背后是他们读不懂的野心(第1节)

2014年6月3日,清晨。

ArXiv,全球最大的学术预印本平台。这东西对搞AI的研究者来说,就是学术圈的朋友圈。

论文上传后二十四到四十八小时内全球可见,不用等同行评审,不用排队走期刊流程,直接面向全世界亮牌。

每天早上起来第一件事,刷ArXiv。

这是所有做深度学习的人的肌肉记忆。

今天早上,这个朋友圈里炸了一颗雷。

论文标题:Deep ReSidUal Learning fOr Image ReCOgnitiOn。

作者:ShaOqing Ren, YUhang Zheng, LiqiU Chen。

单位:JiUTian AI Lab, EChO TeChnOlOgy, China。

斯坦福大学盖茨计算机科学大楼三层,博士后林之远端着咖啡走进办公区,习惯性刷新了CS.CV板块。

他的手停住了,咖啡差点洒出来。

152层卷积神经网络。ImageNet验证集TOp-5错误率,3.57%。

人类标注员的平均水平是5.1%。去年ImageNet竞赛冠军GOOgLeNet是6.67%。这篇论文直接把数字按到了3.57%。

“你们过来看看这个。”

林之远的声音不大,但语调不对。

旁边几个人抬起头,三分钟后,实验室十一个人全围在他屏幕前面。

“等等,152层?”一个叫Kevin的白人博士生最先反应过来,

“不可能。超过三十层的网络根本没法训练,梯度消失会把信号吃干净。这是常识。”

“你往下看。”林之远指着论文第三页的示意图,

“他们加了一个跳跃连接,把输入直接加到输出上。梯度可以跳过中间层回传。”

本章未完,请点击"下一页"继续阅读! 第1页 / 共6页