第238章:确立研究范式 (第2/2页)
回测1 好 差 好 差 差
回测2 差 好 好 差 好
回测3 好 差 差 好 好
“如果你测了一百个因子,然后挑出表现最好的五个——这五个,大概率是运气。因为在随机数据里,总会有一批因子表现特别好,哪怕它们毫无意义。”
他看着小吴:
“这叫‘多重测试偏差’。测的因子越多,偶然发现好结果的概率越大。所以,我们必须用‘样本外测试’来验证——选出来的因子,必须在没见过的数据上重新跑一遍,才能证明它不是运气。”
小吴点头。
陈默听着这些,忽然想起什么。
“周寻,”他问,“你说的这些,在学术界有标准做法吗?”
周寻点头:
“有。一般会把历史数据分成三部分:训练集、验证集、测试集。”
他走到白板前,画了一个新图:
```
历史数据
├── 训练集 (60%): 用来开发策略、调整参数
├── 验证集 (20%): 用来验证策略稳定性、防止过拟合
└── 测试集 (20%): 只在最后用一次,评估真实表现
```
“训练集可以反复用,不断优化。验证集可以偶尔用,检查策略是否过拟合。测试集——只能跑一次,跑完就不能再改。这个结果,才是真正有说服力的。”
他看着陈默:
“我们现在的数据只有五年,分三段的话,每段太短了。但至少,我们可以留出最后一年做‘样本外测试’。”
陈默想了想:
“那就从2009年1月到现在,作为样本外。2005到2008年,作为样本内。所有因子开发,只能用2008年底之前的数据。2009年以后的数据,谁也不许碰。”
他看着所有人:
“这是纪律。”
没有人说话。
但每个人的表情,都比刚才更认真了。
---
中午十二点,流程讨论暂告一段落。
陈默让赵姐去楼下买盒饭,自己站在白板前,看着那张流程图。
周寻走到他身边。
“陈总,”他说,“您刚才说的那些,比我想象的更细。”
陈默看着他:
“细吗?我觉得还远远不够。”
他指着那张图:
“假设、回测、分析、归因——这只是框架。里面还有无数细节:数据怎么清洗,参数怎么调,过拟合怎么防,因子怎么组合……每一步,都可能踩坑。”
他顿了顿:
“但如果不先把框架立起来,那些坑,我们一个也躲不过。”
周寻点头。
两人沉默了几秒。
“周寻,”陈默忽然问,“你在华尔街的时候,这些流程,是必须遵守的吗?”
周寻想了想:
“理论上,是。但实际上,很多人不守。”
“为什么?”
“因为压力。”周寻说,“老板要业绩,客户要收益,市场不等人。有时候看到最近某个策略赚钱,谁都想赶紧上,哪管什么样本外测试。”
他顿了顿:
“我也是因为这个,栽过跟头。”
陈默看着他。
周寻没有细说。
但他懂那种感觉——在压力面前,纪律是第一个被牺牲的东西。
“那我们,”陈默说,“就从一开始,把纪律刻进去。”
他看着墙上那张图:
“不管以后规模多大,不管市场多疯狂,不管客户多急——这个流程,不能破。”
周寻没有说话。
但他点了点头。
---
下午两点,赵姐买回来一块新的白板。
原来的那块太小了,写不了太多东西。
新白板一米五宽,一米高,钉在进门左手边的墙上。
陈默拿起马克笔,把那四个步骤,一字一字抄上去:
默石量化研究标准流程
第一步:提出假设
· 基于经济逻辑或市场观察
· 必须有可验证的因果链
· 严禁“先看结果后编故事”
第二步:回测检验
· 考虑交易成本、冲击成本、滑点
· 使用严格的历史数据
· 不得用收盘价模拟买卖
第三步:统计分析
· 计算关键绩效指标(年化收益、夏普、最大回撤等)
· 分时段分析(牛市/熊市/震荡市)
· 评估稳定性和一致性
第四步:归因分析
· 剥离贝塔(市场涨跌)
· 剥离已知因子(规模、估值、动量等)
· 确认真正的阿尔法来源
特别规定
· 样本外测试:任何策略必须经过至少一年的样本外数据验证
· 数据窥探禁止:严禁根据近期表现调整参数或筛选因子
· 多重测试惩罚:每测试100个因子,显著性阈值需相应提高
抄完最后一个字,他退后一步,看着这块白板。
白花花的底,黑色的字,工工整整。
像一道刚立下的军令状。
小林凑过来看,念出声:
“数据窥探禁止……多重测试惩罚……”
他转过头,看着陈默:
“陈总,这个会不会太严了?”
陈默看着他:
“你觉得严?”
小林想了想:
“有点。万一我们跑了几百个因子,一个都通不过怎么办?”
陈默没有立刻回答。
他走到窗边,看着窗外车公庙的街道。
“那就通不过。”他说,“总比跑出几个假的好因子,然后实盘亏钱强。”
他转过身:
“小林,你要记住一件事——在这个行当,活得久,比跑得快重要一万倍。”
小林沉默了几秒,然后点头。
---
傍晚六点,其他人陆续下班了。
陈默还站在那块白板前。
沈清如从外面回来,推门进来,看见他一个人站在那里。
“还在看?”她问。
“嗯。”陈默说,“在看这面墙。”
沈清如走到他身边,和他并肩站着。
“写得好。”她说。
“不是写得好。”陈默摇头,“是……把以前没有的东西,立起来了。”
他顿了顿:
“以前我们做研究,靠的是感觉。觉得这个公司好,就买。觉得那个行业有前途,就重仓。没有流程,没有纪律,没有检验。”
他指着墙上那四步:
“现在有了。”
沈清如没有说话。
她只是轻轻握住他的手。
两人站在那块白板前,看着那些字。
窗外,车公庙的夜色渐浓。
远处,深南大道上的车流开始亮起灯光。
这间三十平米的办公室里,只有两个人,和一面墙。
但那面墙上,有一个流程。
一个能让他们从“感觉”走向“科学”的流程。
一个能让他们在下一次风暴来临时,不至于再次全军覆没的流程。
陈默忽然想起老陆笔记本上的那句话:
“所有伟大的投资者,最终都是哲学家。因为他们交易的不仅是股票,是对世界的理解,对人性的洞察,对时间的敬畏。”
也许,他们离“伟大”还很远。
但至少,他们开始学会敬畏了。