不同的因子代表股票不同方面的特征,具有不同的计算方法和数值单位,比如市值的单位是元,量级是亿;PE 是比值,没有单位,数量级是个位数或两位数;ROE 是资产收益率,单位是百分比。多因子模型的目标是综合考虑股票多个侧面的特征,最终得到能对股票收益进行预测的 Alpha 因子,如果因子值的单位和数量级都不一样,是无法直接进行加减运算的。当各指标间的量级相差很大时,如果直接用原始指标值进行分析,就会突出数值较高的指标在综合分析中的作用,相对削弱数值较低指标的作用。为了实现多因子模型的目标,需要对模型中的每个因子进行标准化处理,统一因子的单位和数量级,让因子之间能够公平地进行互相比较和加减运算。
最常用的标准化处理方法也称作 Z-Score 方法或者正规化方法,计算过程是:首先,求出指标所有原始数值的均值和标准差;然后,将每个原始数值减去均值后再除以标准差。公式如下

式中,

;

。
在进行标准化处理之前,通常会先做去极值处理,以避免极端值的影响,处理方法一般是将明显极端的数值直接剔除或者替换为某个临界值。经过标准化处理得到的数据符合正态分布,即均值为 0,标准差为 1,超过 99% 的数据会落在[-3,3]区间之内。经标准化处理后的
(本章节未完结,点击下一页翻页继续阅读)