清洗史”的第一页。
整整三年后,他们才真正拥有一套干净的、可用的十年数据库。
而这本笔记本,已经写满了三百多页。
---
下午三点,陈默亲自开始核对数据。
陆方给他分配了第一批任务:2005年到2007年,上证50成分股的日线数据。
一共50只股票,三年,大约750个交易日。每只股票每天有开盘、收盘、最高、最低、成交量、成交额——六个字段。
总共225,000个数据点。
陈默坐在那张折叠桌前,面前摊着三份打印出来的表格——分别来自三个不同的数据源。
他的任务:一行一行比对,把不一致的地方标出来。
第一行,招商银行,2005年1月4日。
来源A:开盘8.52,收盘8.55,最高8.60,最低8.48
来源B:开盘8.52,收盘8.55,最高8.60,最低8.48
来源C:开盘8.51,收盘8.55,最高8.60,最低8.48
开盘价差一分钱。
陈默拿起红笔,在来源C那一列画了个圈。
然后他翻开笔记本,写下:
2005.1.4 招商银行 开盘 来源C=8.51 其他=8.52 差异0.01 暂以多数为准
第二行,2005年1月5日。
三份来源完全一致。
第三行,2005年1月6日。
来源A和C一致,来源B的成交量少了一个零。
陈默愣了一下。
他仔细看了看——来源B的成交量是“1,234,500”,来源A和C是“12,345,000”。差十倍。
他拿起红笔,在来源B那一行画了个大圈。
然后他站起来,走到陆方身后。
“这个,
本章未完,请点击"下一页"继续阅读! 第4页 / 共7页