设置

关灯

第379章 实验室里的深夜对话(第5节)

点给陈曦发消息,陈曦还没睡,在写代码。两个人讨论了大模型的应用。”

沈清如沉默了几秒。“他们这一代,比我们开放。”

陈默笑了。“对。我们当年,遇到问题,只会自己闷头想。他们遇到问题,会找人问。不问年龄,不问资历,只问会不会。”

沈清如看着他。“你不觉得,这是好事吗?”

陈默点头。“好事。所以,我们要向他们学习。”

2024年3月20日,星期三,晚上九点。

陆方还在技术部。他已经连续工作了五天,每天只睡四五个小时。但精神状态很好,因为他把开源模型正式接入了星海平台。两个模型并行跑,结果交叉验证。今天测试了100份招股书,大模型模块对了85份,开源模型对了89份。开源模型胜出。

他给陈曦发消息:“开源模型赢了。89比85。”

陈曦回复:“恭喜!下一步,可以试试多模型集成。把几个模型的预测结果加权平均,准确率还能再提高。”

陆方:“多模型集成?我没试过。”

陈曦:“试试。不复杂。就是把几个模型的输出做加权平均。权重可以用验证集上的准确率来定。”

陆方:“我明天试试。”

陈曦:“好。有结果告诉我。”

陆方放下手机,打开论文,开始研究多模型集成。

2024年3月25日,星期一,上午九点。

技术部晨会。陆方站在白板前,手里拿着马克笔。这次,他的眼袋更深了,但眼神很亮。

“上周,我试了多模型集成。用三个开源模型——LLaMA、Falcon、Bloom——做了加权平均。准确率达到了92.3%,超过了星海大模型模块的89%。”他在白板上写了一个数字:92.3%。

“下一步,我计划把多模型集成正式部署到星海平台。成本比现有模块低50%,准确率高3个百分点。”

本章未完,请点击"下一页"继续阅读! 第5页 / 共8页