设置

关灯

第248章:处理“幸存者偏差”(第2节)

下几个字:

幸存者偏差

“只看到活下来的,看不到死掉的。看到的都是成功案例,看不到失败案例。用这样的数据做回测,结果一定是偏乐观的。”

他转过身,看着所有人:

“你们想想,如果我们的策略,恰好喜欢选那些后来死掉的公司——但在回测数据里,那些公司根本不存在,那回测会显示什么?”

小林脱口而出:

“会显示这个策略很好,因为选的都是活下来的……”

“对。”周寻说,“但实盘呢?实盘里那些公司还在,选了它们,就会亏钱。”

陈默从角落里站起来,走到白板前。

他看着那四个字,沉默了几秒。

然后他问:

“这个问题,有多大?”

周寻想了想:

“可能很大。具体多大,要看我们的策略偏好。”

他走到电脑前,调出一张图:

“这是A股过去十年的退市数据。2001年到2010年,一共有多少家公司退市?”

他敲了几下键盘。

屏幕上跳出一个数字:

187家

“187家。”周寻说,“平均每年18.7家。这些公司,在我们的数据里,一个都没有。”

他顿了顿:

“如果我们的策略,恰好偏好那些后来退市的公司——比如喜欢炒垃圾股、炒ST股——那回测结果和实盘结果的差距,会大得惊人。”

陈默盯着那个数字。

187家。

187个曾经存在过的名字,187个曾经让投资者亏过钱的故事,187个被遗忘的失败案例。

而现在,它们被排除在数据之外,好像从未存在过。

“陆方,”他问,“这个问题,能解决吗?”

陆方想了想:

“能。但要重新爬数据。”

本章未完,请点击"下一页"继续阅读! 第2页 / 共6页