个模型的输出做加权平均。测试结果——准确率94.2%,超过了单一模型。他给陈曦发消息:“多模型集成跑通了。94.2%。”
陈曦:“厉害!夏普比率多少?”
陆方:“1.9。”
陈曦:“不错。继续优化,争取到2.0。”
陆方笑了。他想起2019年,陈曦第一次来公司,画了那张产业链图谱。那时候,她才11岁,什么都不懂。现在,她在伯克利,教他做多模型集成。
他关掉电脑,站起来,走到窗前。窗外,深圳的夏阳炽烈,平安金融中心的玻璃幕墙反射着刺眼的白光。远处,深圳湾的海面平静如镜。他想起周寻说过的话——“淘汰我们的不是技术,是我们不会用技术。”他学会了用技术。不是被技术淘汰,是用技术淘汰别人。这是他的路。
他转过身,走回工位,打开电脑,继续调模型。
2024年8月1日,星期四,上午九点。技术部晨会。陆方站在白板前,手里拿着马克笔。他的眼袋很深,但眼神很亮。
“过去一周,我用开源模型做了微调和多模型集成。准确率从89%提高到94.2%。”他在白板上写了几个数字:89%→94.2%。
“下一步,我计划把开源模型正式接入星海平台,替换掉现有的大模型模块。成本更低,效果更好,而且我们自己可以控制模型,不用依赖外部API。”
周寻举手。“那现有的大模型模块怎么办?”
陆方想了想。“保留。作为备用。两个模型并行跑,结果交叉验证。哪个准,用哪个。”
陈默站在门口,听着陆方的汇报,笑了。他转身走回办公室,对沈清如说:“陆方把准确率提高到94.2%了。”
沈清如抬起头。“这么快?”
“用了陈曦教的方法。开源模型微调,多模型集成。”
沈清如笑了。“这一代,真的不一样。”
陈默点头。“对。
本章未完,请点击"下一页"继续阅读! 第4页 / 共8页