您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国盛证券]:量化专题报告:提升AI模型边际效能:图注意力网络与特征集成 - 发现报告

量化专题报告:提升AI模型边际效能:图注意力网络与特征集成

2024-06-15缪铃凯、刘富兵国盛证券阿***
量化专题报告:提升AI模型边际效能:图注意力网络与特征集成

提升AI模型边际效能:图注意力网络与特征集成 在报告《基于深度学习的指数增强策略》中,我们提出了增强AI选股模型绩效的3个思路: 作者 分析师缪铃凯执业证书编号:S0680521120003邮箱:miaolingkai@gszq.com 1.对同一模型构建差异化数据集输入,堆叠多数据集的输出;2.通过调整超参数选取、标签构建、数据预处理方式等精进单一模型;3.对同一数据集根据不同模型训练,堆叠多模型的输出; 分析师刘富兵执业证书编号:S0680518030007邮箱:liufubing@gszq.com 我们在之前研究中重点讨论了前两者,本文围绕第三个思路展开,探讨如何基于同一数据集,在不同模型下训练并堆叠因子输出,以提升模型效能。 相关研究 1、《量化点评报告:可转债正股退市风险加大——六月可转债量化月报》2024-06-11 2、《量化周报:中证500、深证成指、创业板指迎来日线级别下跌》2024-06-103、《量化分析报告:择时雷达六面图:资金面大幅弱化》2024-06-094、《量化分析报告:行业景气选股策略今年绝对收益13%——基本面量化系列研究之三十二》2024-06-065、《量化点评报告:六月配置建议:寻找具有微观优势的品种》2024-06-04 多维度提升AI选股模型绩效 首先,我们在时序神经网络中引入图结构网络,以此刻画股票之间的关联,该空间信息的引入增强了单一数据集的预测能力; 其次,我们在原有基础数据集之外引入手工构建的量价和基本面特征集合,手工特征集显著捕获了端对端模型之外的增量Alpha信息; 最后,在特征集成阶段,我们考虑数据输入、算法使用与标签设计等维度的多样性,综合构建集成模型,这进一步提高了模型的选股能力。 深度学习选股因子 基于多维度特征集合、集成算法与标签设计,我们得到深度学习选股因子,在回溯期2019年至2023年间,因子多头超额收益45.4%,5日IC均值为12.9%,10日IC均值达到14.7%。 指数增强组合 基于AI选股因子,我们构建周频调仓的中证500和中证1000指增组合: 1.2019至2023年,中证500指数增强组合相对中证500指数年化超额收益18.6%,跟踪误差5.5%,信息比率2.98;2.2019至2023年,中证1000指数增强组合相对中证1000指数年化超额收益28.1%,跟踪误差6.4%,信息比率3.67。 风险提示:结论基于历史数据以及模型推算,存在失效风险。 内容目录 一、AI选股模型....................................................................................................................................................3二、数据与网络.....................................................................................................................................................42.1数据输入..................................................................................................................................................42.2网络结构..................................................................................................................................................5三、因子信号........................................................................................................................................................73.1基础数据集...............................................................................................................................................73.2手工特征数据集........................................................................................................................................8四、特征集成.......................................................................................................................................................10五、指增策略.......................................................................................................................................................135.1中证500指数增强...................................................................................................................................135.2中证1000指数增强.................................................................................................................................14五、总结..............................................................................................................................................................15风险提示..............................................................................................................................................................16 图表目录 图表1:中证500指增(80%成分权重下限)..........................................................................................................3图表2:中证1000指增(80%成分权重下限)........................................................................................................3图表3:AI选股模型结构........................................................................................................................................3图表4:图注意力机制............................................................................................................................................6图表5:基础数据集因子相关性..............................................................................................................................7图表6:基础数据集因子绩效..................................................................................................................................7图表7:alpha158因子分类....................................................................................................................................8图表8:手工特征集因子相关性..............................................................................................................................9图表9:apha158因子绩效.....................................................................................................................................9图表10:fundamental因子绩效.............................................................................................................................9图表11:特征合并示意图......................................................................................................................................10图表12:LSTM因子集合集成绩效.........................................................................................................................11图表13:LSTM-GAT因子集合集成绩效..................................................................................................................11图表14:加入手工数据后因子绩效..............................................