设置

关灯

第384章 17岁,跨洋代码(第2节)

陆方震惊——LLaMA-7B的准确率最高,达到91.5%,比星海大模型模块的89%高出2.5个百分点。Falcon-7B达到90.2%,Bloom-7B达到89.8%。三个模型的平均准确率90.5%,超过了星海。

陆方看着那个数字,沉默了很久。他想起自己花了三个月时间调参数、优化模型,准确率只提高了1个百分点。陈曦只花了一个晚上,用开源模型微调,就把准确率提高了2.5个百分点。不是他不够努力,是方向错了。

他给陈曦发消息:“结果收到了。开源模型确实比我们的好。”

陈曦:“不是我强,是模型强。你们也可以试试。开源模型,成本低,效果好。不用自己从头训练。”

陆方:“我试试。”

陈曦:“需要帮忙吗?”

陆方:“需要。你教我怎么微调。”

陈曦:“好。我写个教程给你。”

陆方看着那行字,笑了。他想起2019年,陈曦第一次来公司,画了那张产业链图谱。那时候,她才11岁,什么都不懂。现在,她在伯克利,教他做大模型。时间过得真快。

陆方:“你才学多久,就比我们强了。”

陈曦:“不是我强,是模型强。你们也可以试试。”

陆方:“已经在试了。等你回来,我们一起做星海4.0。”

陈曦:“好。一言为定。”

2024年7月27日,星期六,上午九点。陈默走进技术部,看到陆方正对着屏幕发呆。

“怎么了?”陈默问。

陆方转过头。“陈总,昨天陈曦帮我跑了开源模型测试,准确率91.5%,比星海大模型模块高2.5个百分点。”

陈默愣了一下。“她怎么做到的?”

“用开源模型微调。LLaMA、Falcon、Bloom。在伯克利的服务器上跑了一个晚上。”

陈默走到屏幕前,

本章未完,请点击"下一页"继续阅读! 第2页 / 共8页