设置

关灯

第386章 能读研报,还能写摘要(第3节)

司研报的理解能力弱于A股。因为训练数据中,港股研报的比例较低。”

沈清如点头。“那就增加港股研报的训练数据。”

陆方说。“已经在做了。陈曦在伯克利那边也在帮我们爬数据。”

沈清如笑了。“她比我们当年强。”

陆方也笑了。“对。”

上午十一点,陈默办公室。沈清如推门进来,手里拿着测试结果。

“星海3.5的摘要准确率,A股研报92%,港股研报80%。总体88%。”

陈默接过报告,看了一遍。“88%已经很高了。人也就90%。”

沈清如在他对面坐下。“但幻觉问题还是存在。万一研报里关键数据错了,星海摘要也跟着错,我们就会踩雷。”

陈默点头。“所以,不能完全信任。人机结合,它出活,人复核。”

沈清如说。“我让研究员每天下午三点前,复核当天的星海摘要。错的地方标注出来,反馈给技术部优化模型。”

“好。”

下午两点,技术部。陆方收到研究部反馈的第一批错误数据。他打开日志,一行一行地看。幻觉——某公司营收增速15%,星海写成18%。语义理解错误——“目标市占率”理解成“实际市占率”。数据遗漏——某公司经营性现金流为负,星海摘要没提。他一一把问题记录下来,然后开始调参数。

周寻走过来。“怎么样?”

陆方头也没回。“幻觉率还是高。需要更多的训练数据。”

周寻想了想。“让陈曦在伯克利那边多爬一些数据。英文研报也行,可以翻译成中文。”

陆方点头。“已经在做了。”

下午四点,陆方收到陈曦发来的一批新数据——5000份英文研报,覆盖美股、港股、A股。她写了爬虫,从公开渠道抓取,然后用开源模型翻译成中文。数据量有十几G,用云盘传了一下午。

陆方给她发消息:“

本章未完,请点击"下一页"继续阅读! 第3页 / 共7页