点给陈曦发消息,陈曦还没睡,在写代码。两个人讨论了大模型的应用。”
沈清如沉默了几秒。“他们这一代,比我们开放。”
陈默笑了。“对。我们当年,遇到问题,只会自己闷头想。他们遇到问题,会找人问。不问年龄,不问资历,只问会不会。”
沈清如看着他。“你不觉得,这是好事吗?”
陈默点头。“好事。所以,我们要向他们学习。”
2024年3月20日,星期三,晚上九点。
陆方还在技术部。他已经连续工作了五天,每天只睡四五个小时。但精神状态很好,因为他把开源模型正式接入了星海平台。两个模型并行跑,结果交叉验证。今天测试了100份招股书,大模型模块对了85份,开源模型对了89份。开源模型胜出。
他给陈曦发消息:“开源模型赢了。89比85。”
陈曦回复:“恭喜!下一步,可以试试多模型集成。把几个模型的预测结果加权平均,准确率还能再提高。”
陆方:“多模型集成?我没试过。”
陈曦:“试试。不复杂。就是把几个模型的输出做加权平均。权重可以用验证集上的准确率来定。”
陆方:“我明天试试。”
陈曦:“好。有结果告诉我。”
陆方放下手机,打开论文,开始研究多模型集成。
2024年3月25日,星期一,上午九点。
技术部晨会。陆方站在白板前,手里拿着马克笔。这次,他的眼袋更深了,但眼神很亮。
“上周,我试了多模型集成。用三个开源模型——LLaMA、Falcon、Bloom——做了加权平均。准确率达到了92.3%,超过了星海大模型模块的89%。”他在白板上写了一个数字:92.3%。
“下一步,我计划把多模型集成正式部署到星海平台。成本比现有模块低50%,准确率高3个百分点。”
本章未完,请点击"下一页"继续阅读! 第5页 / 共8页