本报告使用遗传编程(GP)挖掘共识因子,是GP系列研究的第四篇。报告针对共识数据的特点量身定制了数据处理方案,并适配了GP中的矩阵运算算法,使得在短时间内挖掘大量因子成为可能。对于结果,我们在报告中显示了挖掘的 11 个因子及其测试结果,这些因子具有高度的可解释性。我们还详细分析了因素的构建逻辑和模式。报告中使用的共识数据包括:EPS、ROE、PE、PB等财务指标的共识,以及盈利预测修正、分析师预测标准差等衍生数据。报告中还引入了实际PE_TTM,结合共识数据挖掘复合因子。在实际实践中,我们主要修改了gplearn的因子计算模块,支持三维数据结构的矩阵运算。