设置

关灯

第12章 李代码的爬虫初战(第2节)

# 计算基础情感分

base_score = len([w for w in text if w in positive_words]) - len([w for w in text if w in negative_words])

# 应用衰减

final_score = base_score * time_factor

return final_score

运行。没有报错。进度条开始缓慢爬升:1%...5%...12%...

李代码靠在椅背上,闭上眼睛。他能听见机箱风扇的嗡鸣,能闻到自己身上的汗味,能感觉到心脏因为过度摄入***而不规则地跳动。但更多的是兴奋——一种即将揭开市场面纱的兴奋。

他想证明,这个由贪婪和恐惧驱动的市场,是可以被量化的。那些看似随机的波动,那些突如其来的涨停跌停,那些“消息灵通人士”的“内幕消息”,归根结底都是情绪的共振。而情绪,是可以被测量的。

进度条爬到100%。终端弹出结果:

今日市场情绪指数:-0.34(偏悲观)

热门板块情绪排名:

1. 新能源汽车:+0.87

2. 半导体:+0.45

3. 白酒:-1.23

...

李代码盯着屏幕。新能源汽车板块情绪分最高,符合预期——最近政策利好不断。白酒板块情绪分最低,也合理,毕竟估值在高位,资金有出逃迹象。但半导体只有+0.45,这有点意外。他看了几篇研报,都说半导体景气度持续,资金在流入。

他的爬虫说不是。

他调出原始数据:抓取的八千多条关于半导体的讨论中,“卡脖子”“制裁”“产能过剩”等负面词出现频率是正面的两倍。虽然研报乐观,但散户情绪已经转向悲观。

本章未完,请点击"下一页"继续阅读! 第2页 / 共7页