第248章:处理“幸存者偏差” (第2/2页)
小林在旁边举手:
“周老师,那些找不到数据的公司,我们怎么处理?”
周寻想了想:
“两种办法。”
他走到白板前,写:
方法一:用同类公司替代
“找不到具体数据的,可以用那个时期、那个行业的同类公司数据做近似替代。虽然不精确,但至少能反映一个大致水平。”
方法二:做敏感性分析
“假设这些找不到数据的公司,表现比我们查到的差。差多少?10%?20%?跑几个不同的假设,看结果变化有多大。”
他放下笔:
“目的不是精确还原历史,是知道我们可能‘偏’了多少。”
小林点头,在本子上记着。
---
傍晚六点,陆方还在研究那些退市公司的名单。
他已经找到了87家公司的历史数据。还剩100家,怎么也找不到。
屏幕上,是那100家公司的名字——或者说,是曾经存在过的名字。
ST红光、PT水仙、ST九州、ST银广夏、ST生态、ST猴王……
有些名字,陆方听说过。那是当年轰动一时的造假案、退市案的主角。有些名字,他完全陌生,只是一个个冰冷的代码。
他盯着那些名字,忽然有一种奇怪的感觉。
这些公司,曾经也是无数人的希望。
有人在这里投过钱,有人在这里亏过钱,有人在这里赚过钱然后亏回去,有人在这里把一辈子的积蓄赔光。
现在,它们只是回测系统里需要补上的“数据缺口”。
“陆方,”周寻走过来,“还在看?”
陆方点头。
“想什么呢?”
陆方想了想:
“在想,如果2008年我们破产了,现在会不会也在某个数据源的‘已退市’列表里。”
周寻愣了一下。
然后他轻声说:
“也许吧。”
他走到窗边,看着外面车公庙的夜色:
“但我们现在还在这里。”
陆方没有说话。
他转回头,继续看那些名字。
然后他打开一个文档,开始记录:
“退市公司补录进度:已找到87家,待找100家。预计完成时间:未知。”
他顿了顿,又在下面加了一行:
“那些已经消失的公司,值得被记住。”
---
晚上八点,陈默回到办公室。
他看到陆方还在,周寻也在。
“还没走?”他问。
陆方抬起头:
“在整理退市公司的名单。有些实在找不到。”
陈默走过去,看着屏幕上那长长的列表。
那些陌生的代码,那些曾经存在过的名字。
他忽然想起2001年的一件事。
那一年,他买过一只股票,叫“银广夏”。那时候它还风光无限,是市场的明星。他赚了点钱,卖掉了。
后来,银广夏被查出财务造假,股价从30多块跌到2块多,最后退市。
那些没卖掉的人,亏得倾家荡产。
陈默看着那个名字,沉默了很久。
“陆方,”他忽然说,“你知道银广夏吗?”
陆方点头:“听说过。当年的大案。”
陈默指着那个名字:
“我买过。”
陆方抬起头,看着他。
陈默继续说:
“2000年买的,2001年初卖的。赚了点钱。后来它爆雷,退市。那些在最高点买入的人,亏了90%以上。”
他顿了顿:
“如果我的策略,在2000年选了银广夏,回测会显示什么?会显示我赚钱了。因为2000年它还在涨。但2001年之后呢?那些数据,在我的回测里,可能根本不存在。”
他看着陆方:
“所以,你说的对。这些公司,必须补进来。不管数据多难找,都要找。”
陆方点了点头。
他低下头,继续敲键盘。
屏幕上,那些名字一个一个闪过。
每一个名字背后,都有一个故事。
有些故事已经被人遗忘。
但在这个三十平米的办公室里,有人正在把它们重新记起来。
---
深夜十一点,陆方终于找到了第88家退市公司的数据。
是一家叫“ST红光”的公司,1997年上市,2004年退市。数据藏在某个老旧的数据库里,用了三个代理IP才爬下来。
他看着屏幕上那一条条K线,从上市到退市,七年的时间,浓缩成一个长长的、向下的曲线。
上市时6块,最高冲到12块,然后一路下跌。最后退市的时候,股价0.8元。
那些在12块买入的人,亏了93%。
陆方盯着那条曲线,看了很久。
然后他打开一个文件夹,把这份数据存了进去。
文件夹的名字叫:
“那些已经消失的公司”