千张GPU?”
他重复了一遍,语气带着学者特有的审慎,
“你个人……”
“公司的。”
顾屿把手从裤兜里抽出来,顺手从走廊的椅架上拖过一把椅子坐下,一副刚吃完饭打算聊会儿天的架势,
“雅安大渡河边上,有个数据中心,目前主要跑推荐算法,顺带挖点矿。”
“挖矿。”
任少卿重复了这两个字。
“嗯。”
沉默了两秒。“你是哪家公司的HR?”
“不是HR。”
“销售?”
“也不是。”
顾屿抬起眼皮,
“我是老板。”
任少卿把双肩包的带子往肩上提了提,往石柱方向靠了半步。
这是他多年来养成的习惯。
离不确定因素保持一定物理距离。
“行,”
他语气极其克制,
“算你有GPU。但你刚才说,我现在卡的瓶颈不是算力——”
“对。”
“那是什么?”
“是你对'规模'这件事的理解,停在一个错误的框架里。”
顾屿靠上椅背,右腿搭在左膝上,
“你现在的逻辑是:更大的模型,更多的数据,更强的算力,效果就会越来越好。这个方向本身没问题。但你少算了一件事。”
任少卿没说话。
“效率。”
顾屿吐出两个字,
“你的模型在做大量无效计算。它用同样的力气处理每一个输入,不管那个输入重不重要,不管当前任务简单还是复杂。这是架构设计上的浪费,不是数据和算力能补回来的。”
“你说的这个问题,”
任少卿的眉头拧了一下,
“在卷积结构里,局部感受野决定了模型必须平等对待每一个特征图的位置,
本章未完,请点击"下一页"继续阅读! 第2页 / 共6页