设置

关灯

第379章 实验室里的深夜对话(第3节)

你一篇论文,你看看。”

陆方收到一篇论文,标题是《Fine-tuning LLaMA for Financial Text Analysis》。他点开,快速浏览。方法不复杂,数据量也不大。他觉得自己能复现。

陆方:“谢谢你。我明天试试。”

陈曦:“不客气。陆方叔叔,不要怕被淘汰。你们那一代人,从手绘K线到量化模型,已经进化了一次。现在,从量化模型到大模型,再进化一次就行了。”

陆方看着那行字,沉默了很久。他想起周寻说的话——“陈总当年从技术分析转到基本面,再从基本面转到量化,每一次都在学新东西。”是的。他也可以学。

陆方:“你说得对。谢谢你。”

陈曦:“不客气。早点睡。”

陆方:“你也是。”

放下手机,陆方打开那篇论文,开始认真读。

2024年3月16日,星期六,上午九点。

陆方没有回家。他在技术部通宵了。他按照论文的方法,用开源模型LLaMA-7B,在星海的数据集上做微调。第一次跑,显存不够。他换了一个更小的模型,跑通了。准确率不高,只有70%。他调整了参数,再跑,75%。再调,80%。再调,83%。到上午九点,准确率稳定在85%左右。和星海的大模型模块持平。但他用的是开源模型,成本只有原来的十分之一。

他兴奋地给陈曦发消息:“陈曦,我跑通了。准确率85%。”

陈曦回复:“恭喜!再试试更大一点的模型?7B不行,就13B。我用13B跑过,准确率能到90%。”

陆方:“13B需要更大的显存。我没有。”

陈曦:“用云服务。按需付费,不贵。”

陆方:“我试试。”

他注册了一个云服务账号,租了一台带A100显卡的服务器。按小时计费,一小时十几块钱。他把模型上传,

本章未完,请点击"下一页"继续阅读! 第3页 / 共8页