前文提到,研究是量化投资的核心,而量化投资进行研究的「大杀器」就是历史回溯测试。量化投资的研究工作就是不停地进行策略螺旋迭代,但稍有不慎就会落入陷阱,使得好不容易开发出来的看起来很完美的策略用真金白银投资后就出现亏损。
量化投资研究中最主要的陷阱有三个:幸存者偏差,使用未来数据,过度拟合。
1)幸存者偏差是误排除了目前已被退市或因其他原因消失的品种。将已淘汰的品种排除掉,只留下幸存者,也会使回测收益率偏好。在历史回溯时要特别注意,不能贪图数据处理的方便,直接用当前的股票池进行历史回溯,而是要切切实实地还原历史的情况,保留历史上每个时点的股票数据。
2)使用未来数据,简单说就是在历史回溯时穿越时空,把后来发生的信息也一起带回去了。比如,在年报公布前使用年报的市盈率,在收盘前使用收盘价。将未知当作已知,会使回测收益率偏高。因此要在回溯测试环境上构造一个数据过滤网,排除所有可能用到未来信息的数据,从源头上保证策略在回溯时不会用到任何未来的信息。
3)拟合是优化策略的重要方法,但过度拟合会使策略在回溯测试阶段其本身优异的表现无法在实盘上线后复现,俗称「见光死」。一个策略,确定了基本的投资框架和交易规则之后还需要进行微调和优化,进一步提高收益并降低波动。这个微调优化的过程,就是拟合。过度拟合会使策略失去通用性,虽然能在历史回溯时拟合出非常漂亮的收益曲线,但并没有什么实际意义,毕竟我们不能真正地穿越时空去赚钱,投资还是要面向未来。解决过度拟合的方法主要是:参数不要太多,做好样本内测试和样本外检验,进行参数敏感性分析。量化策略应该是具有真实世界经济含义的投资逻辑,而不是根据一些试错法则穷举出来的结果,从而使模型可以覆盖过去以及未来更广泛的市场情况。
 
(本章节完结)