行业研究公司研究宏观策略财报招股书会议纪要海南封关低空经济 DeepSeek AIGC 大模型

因子选股系列之一〇三：DFQ-FactorVAE：融合变分自编码器和概率动态因子模型的alpha预测方案

2024-05-14杨怡玲、刘静涵东方证券x***

报告发布日期 DFQ-FactorVAE：融合变分自编码器和概率动态因子模型的alpha预测方案 ——因子选股系列之一〇三杨怡玲yangyiling@orientsec.com.cn执业证书编号：S0860523040002刘静涵021-63325888*3211liujinghan@orientsec.com.cn执业证书编号：S0860520080003香港证监会牌照：BSX840 研究结论 FactorVAE模型架构 ⚫FactorVAE模型，来自国际人工智能会议AAAI 2022。原论文中提出了一种新的基于变分自编码器的概率动态因子模型，以弥合噪声数据与有效因子之间的差距。本文在原论文基础上进行修改优化，所得选股因子在沪深300指数增强组合中表现优异。 ⚫FactorVAE模型融合了变分自编码器与概率动态因子模型的思想，建立股票收益率预测模型，学习输入特征和标签之间的关系：（1）采用变分自编码器的编码器-解码器架构，有助于模型学习到数据分布的结构，并且可以在潜在空间中生成新样本；（2）采用概率动态因子模型的思想，将因子作为VAE模型中的潜在变量，提取动态公共因子的分布，从而起到降维降噪的作用。（3）采用一种“前验-后验”的学习方法，将预测股票收益率的问题转化成预测有效因子，使用标签收益率指导模型提取有效因子。基本面因子的重构：——因子选股系列之一〇二2024-03-21自适应时空图网络周频alpha模型：——因子选股系列之一〇一2024-02-28DFQ-HIST：添加图信息的选股因子挖掘系统：——因子选股系列之一百2024-02-07基于异构图神经网络的股票关联因子挖掘：——因子选股系列之九十九2024-01-02DFQ-TRA：多交易模式学习因子挖掘系统：——因子选股系列之九十七2023-11-14DFQ强化学习因子组合挖掘系统：——因子选股系列之九十五2023-08-17DFQ遗传规划价量因子挖掘系统：——因子选股系列之九十2023-05-28 DFQ-FactorVAE模型优势 ⚫DFQ-FactorVAE模型所得因子的稳定性、在沪深300股票池中的多头表现突出：（1）在中证全指股票池中，DFQ-FactorVAE模型所得到因子的稳定性明显最强，ICIR、RANKICIR、多头日超额收益夏普比均为最高。测试集（2020.01.01-2024.03.31）上rankic达到15%，rankicir达到1.38，20分组多头日度超额年化收益率达到31.75%，多头日超额收益夏普比3.52，多头日度超额收益最大回撤8.28%，多头月度胜率88%，月均单边换手79%。分组单调性好。（2）在沪深300股票池中，DFQ-FactorVAE模型所得到因子的多头表现明显最强。测试集上rankic达到10.6%，rankicir达到0.6，5分组多头日度超额年化收益率达到14.47%，多头日超额收益夏普比1.72，多头日度超额收益最大回撤6.74%，月均单边换手54%。分组单调性好。分年表现上未出现明显衰减。 ⚫DFQ-FactorVAE模型所得因子稳定性突出，与模型的VAE架构和概率框架有关。VAE架构有助于模型学习到数据分布的结构，样本外泛化能力更强。概率框架考虑到了风险建模，更适合含有噪声的股票收益率预测。 ⚫DFQ-FactorVAE模型所得因子在沪深300股票池中的多头表现突出，与模型的因子模型架构有关。先验因子对沪深300股票的解释度最高，平均能达到36.5%，其次为中证500成分股的27.95%，中证1000成分股的25.45%，全市场解释度最低，为20.78%。 DFQ-FactorVAE模型在沪深300指增组合中的表现 ⚫DFQ-FactorVAE模型所得到的合成因子在沪深300指增组合中表现十分突出：（1）整体表现：2020年以来年化信息比达到2.55，年化对冲收益13.53%，年化跟踪误差5.03%，超额收益最大回撤仅为5.35%，单边年换手7.67倍。（2）分年表现：2020-2023每年取得10%以上的正超额，2023年超额收益达16%。2024年前三个月超额收益为-0.36%。（3）风格暴露：相对基准沪深300指数，组合在市值、信息确定性、成长维度具有明显的负向暴露，但在BETA、流动性、波动率、估值等维度都没有明显暴露。（4）成分股约束：设置100%成分内选股增强，可以明显提高组合业绩表现稳定性。跟踪误差可以降低到4.37%，超额收益最大回撤降低到3.31%，最大回撤恢复仅需30天，并且仍然可以获得超过10%的年化超额。风险提示 1.量化模型失效风险。2.极端市场环境对模型的影响。目录一、模型概述.................................................................................................5 1.1自编码器（Auto Encoder, AE）...................................................................................51.2变分自编码器（Variational Auto-Encoder, VAE）........................................................51.3因子模型（Factor Model）..........................................................................................61.4概率动态因子模型（Probabilistic Dynamic Factor Model）.........................................61.5 FactorVAE....................................................................................................................6 二、模型架构.................................................................................................7 2.1模型训练和预测过程.....................................................................................................72.2特征提取器...................................................................................................................82.3因子编码器...................................................................................................................92.4因子解码器.................................................................................................................102.5因子预测器.................................................................................................................11 三、模型说明...............................................................................................12 3.1数据说明....................................................................................................................123.2模型输入....................................................................................................................123.3模型参数....................................................................................................................13 四、模型结果...............................................................................................14 4.1运算用时....................................................................................................................144.2因子绩效表现.............................................................................................................144.3随机种子的影响..........................................................................................................214.4与其他量价模型相关性...............................................................................................214.5中性化因子表现..........................................................................................................23 五、沪深300指数增强组合.........................................................................24 5.1指数增强组合构建说明...............................................................................................245.2指数增强组合的业绩表现...........................................................................................245.3指数增强组合的风格暴露...........................................................................................255.4组合优化约束对组合业绩的影响.....

点击免费查看完整报告

你可能感兴趣

因子选股系列之一〇三：DFQ-FactorVAE：融合变分自编码器和概率动态因子模型的alpha预测方案

你可能感兴趣

因子选股系列之一〇七：DFQ-XGB：基于树模型的alpha预测方案

因子选股系列之一〇八：dd-Ensemble：基于知识蒸馏的alpha因子挖掘模型

因子选股系列之一〇四：融合基本面信息的ASTGNN因子挖掘模型

因子选股系列之一一〇：ABCM：基于神经网络的alpha因子和beta因子协同挖掘模型

《因子选股系列研究之八》：动态情景多因子Alpha模型