下几个字:
幸存者偏差
“只看到活下来的,看不到死掉的。看到的都是成功案例,看不到失败案例。用这样的数据做回测,结果一定是偏乐观的。”
他转过身,看着所有人:
“你们想想,如果我们的策略,恰好喜欢选那些后来死掉的公司——但在回测数据里,那些公司根本不存在,那回测会显示什么?”
小林脱口而出:
“会显示这个策略很好,因为选的都是活下来的……”
“对。”周寻说,“但实盘呢?实盘里那些公司还在,选了它们,就会亏钱。”
陈默从角落里站起来,走到白板前。
他看着那四个字,沉默了几秒。
然后他问:
“这个问题,有多大?”
周寻想了想:
“可能很大。具体多大,要看我们的策略偏好。”
他走到电脑前,调出一张图:
“这是A股过去十年的退市数据。2001年到2010年,一共有多少家公司退市?”
他敲了几下键盘。
屏幕上跳出一个数字:
187家
“187家。”周寻说,“平均每年18.7家。这些公司,在我们的数据里,一个都没有。”
他顿了顿:
“如果我们的策略,恰好偏好那些后来退市的公司——比如喜欢炒垃圾股、炒ST股——那回测结果和实盘结果的差距,会大得惊人。”
陈默盯着那个数字。
187家。
187个曾经存在过的名字,187个曾经让投资者亏过钱的故事,187个被遗忘的失败案例。
而现在,它们被排除在数据之外,好像从未存在过。
“陆方,”他问,“这个问题,能解决吗?”
陆方想了想:
“能。但要重新爬数据。”
本章未完,请点击"下一页"继续阅读! 第2页 / 共6页