您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[东证期货]:金融工程深度报告:如何从ETF的提纯Alpha中学习信息 - 发现报告
当前位置:首页/其他报告/报告详情/

金融工程深度报告:如何从ETF的提纯Alpha中学习信息

2024-01-22王冬黎、徐凡东证期货y***
金融工程深度报告:如何从ETF的提纯Alpha中学习信息

深度报告——金融工程 如何从ETF的提纯Alpha中学习信息 报告日期:2024年01月22日 ★被动指数化投资是未来的趋势 随着近年来市场波动加剧,主动管理的难度不断加大,在近三年、近两年和近一年的统计区间内,主动权益产品和指增产品相较行业板块和宽基指数的平均超额收益衰减显著。相比之下,被动ETF产品的规模逐渐增加,自2017年的1817亿元增长至2023年的13998亿元,平均保持着40%的年化增长率,同期公募机构在ETF产品上的持仓权重也从0.04%增长至5.12%,由此可见,被动指数化投资的增长趋势显现。 ★截面打分模型构建 本文以自下而上的视角构建ETF组合,从全市场ETF产品(剔除宽基指数)映射至标的指数,在该标的指数池上训练模型,再回溯至(某一时期内)成交量最大的跟踪产品。在模型构建细节上,我们分别从标的指数和成分股两个维度提取66个特征,以各个标的经风格因子回归后的Alpha为目标,滚动训练前馈网络以拟合特征与目标间非线性关系。就标的指数回测而言,我们分别测试了四种构建组合的方式以及对应的四个不同调仓周期,结果显示等权模型不同周期的预测值和短周期(五日)调仓结果最优。 ★在不同ETF标的池下的回测结果 我们构造ETF组合的方式为五日调仓,以等权不同周期预测值生成标的指数信号,最后回溯至跟踪标的指数的(近一个月成交量最大)ETF产品构造组合。同时,我们分别在全市场ETF(剔除宽基)标的池、股票型ETF标的池、主题指数型ETF标的池和行业指数ETF标的池滚动测试效果,结果显示除了行业指数ETF标的池外,其余组合相较于中证800和标的池平均的超额收益均显著。 ★风险提示 指标计算和策略收益基于历史数据得出,不排除失效的可能性。 王冬黎金融工程首席分析师从业资格号:F3032817 投资咨询号:Z0014348Tel:8621-63325888-3975 Email:dongli.wang@orientfutures.com 联系人 徐凡金融工程助理分析师 从业资格号:F03107676Tel:8621-63325888-3975 Email:fan.xu@orientfutures.com 金融工程 重要事项:本报告版权归上海东证期货有限公司所有。未获得东证期货书面授权,任何人不得对本报告进行任何形式的发布、复制。本报告的信息均来源于公开资料,我公司对这些信息的准确性和完整性不作任何保证,也不保证所包含的信息和建议不会发生任何变更。我们已力求报告内容的客观、公正,但文中的观点、结论和建议仅供参考,报告中的信息或意见并不构成交易建议,投资者据此做出的任何投资决策与本公司和作者无关。 有关分析师承诺,见本报告最后部分。并请阅读报告最后一页的免责声明。 目录 1.被动指数化投资是未来的趋势5 1.1.ETF产品逐渐丰富,其交易热度和关注度逐渐增加5 1.2.主动管理产品的超额收益逐渐减少,被动产品的优势逐渐显现6 1.3.以自下而上的视角,构建截面打分的ETF轮动策略6 2.截面打分模型:变量选取、目标构造和深度学习模型7 2.1.变量选取:成分股特征和指数行情特征7 2.2.目标构建:回归后的Alpha是更稳健的目标9 2.3.深度学习模型的构造及训练机制10 3.回测结果:等权集成模型和短周期调仓是组合关键13 3.1.全市场ETF(剔除宽基)产品池的组合结果16 3.2.股票型ETF产品池的组合结果16 3.3.主题指数ETF产品池的组合结果17 3.4.行业指数ETF产品池的组合结果18 4.总结与展望18 5.风险提示18 2期货研究报告 图表目录 图表1:产品类型以股票型ETF和主题指数ETF为主5 图表2:ETF相较主动权益基金个数占比逐年增加5 图表3:三大主要类型的ETF成交热度逐步提升5 图表4:ETF规模稳步增长,机构投资者占比稳定5 图表5:主动权益基金的超额(相较指数)逐年递减6 图表6:近年来公募指数增强的超额收益同样衰减明显6 图表7:以自下而上的视角,构建ETF策略的逻辑7 图表8:截面打分模型使用到的成分股因子和指数因子8 图表9:因子间的相关系数(色调为-1至1)8 图表10:因子类内(二级分类)相关系数的分布8 图表11:五个风格因子的日度走势图(2007/01/01–2023/12/31)9 图表12:平均时序标准差随窗口期的变化10 图表13:平均截面标准差随窗口期的变化10 图表14:(两个隐藏层)前馈网络的计算机制11 图表15:本文使用的网络结构示意表11 图表16:ReLU的表达式11 图表17:LeakyReLU的表达式(𝖺=0.05)11 图表18:就量纲而言,CCC相较MSE更稳定12 图表19:就极值而言,CCC相较IC更稳定12 图表20:时序交叉验证的滚动训练流程12 图表21:模型构建细节汇总13 图表22:在样本外,五日调仓周期的分组累计收益14 图表23:在样本外,十日调仓周期的分组累计收益14 图表24:在样本外,二十日调仓周期的分组累计收益14 图表25:在样本外,等权合成的分组累计收益14 图表26:在样本外,四个模型结果的累计RankIC值15 图表27:四种不同组合相对标的指数池的超额收益15 图表28:经转换后的目标(五日)的平均自相关性高15 图表29:(100个随机)标的指数的波动-收益散点图15 图表30:在全市场ETF标的池中,等权组合和波动率倒数组合的超额净值16 图表31:在全市场ETF标的池中,ETF组合的统计表现(收益和超额)16 图表32:在股票型ETF标的池中,等权组合和波动率倒数组合的超额净值17 图表33:在股票型ETF标的池中,ETF组合的统计表现(收益和超额)17 图表34:在主题指数ETF标的池中,等权组合和波动率倒数组合的超额净值17 图表35:在主题指数ETF标的池中,ETF组合的统计表现(收益和超额)17 图表36:在行业指数ETF标的池中,等权组合和波动率倒数组合的超额净值18 图表37:在行业指数ETF标的池中,ETF组合的统计表现(收益和超额)18 1.被动指数化投资是未来的趋势 1.1.ETF产品逐渐丰富,其交易热度和关注度逐渐增加 截至2023年12月底,存续的共计891只产品,其中以股票ETF(31%)、主题指数ETF(26%)和规模指数ETF(17%)为主。我们根据Wind统计ETF新增和主动权益基金新增(标签为普通股票型基金、偏股混合型基金和平衡混合型基金),以两者个数的比值表征发行量随时间变化,三种主要被动产品均在2010年后呈现增长态势,从2011年末的2.19%(股票型ETF/主动权益)、3.51%(主题指数ETF/主动权益)和 1.32%(规模指数ETF)增长至2023年末的5.01%、4.17%和2.72%。 图表1:产品类型以股票型ETF和主题指数ETF为主图表2:ETF相较主动权益基金个数占比逐年增加 资料来源:Wind,东证衍生品研究院资料来源:Wind,Ricequant,东证衍生品研究院 三大ETF产品的日成交额约为541亿元,自2016年的29亿元增长18倍。在同样区间下,成交额相较于全A股的成交额占比从0.4%提升至6.5%,从成交热度来看,三种主要的ETF产品类型日成交额提升明显,相较于全A股市场成交额的比例逐渐增加。 图表3:三大主要类型的ETF成交热度逐步提升图表4:ETF规模稳步增长,机构投资者占比稳定 资料来源:Ricequant,东证衍生品研究院资料来源:Ricequant,东证衍生品研究院 ETF的规模稳步增长,多数机构投资者对被动产品的关注度逐渐增加。通过测算股票ETF、主题指数ETF和规模指数ETF三类被动产品自2017年至2023年底的规模数据,以及同期公募产品在被动产品上的持仓权重,在右上图中可以看出ETF的规模增长迅速,自2017年的1817亿元增长至2023年的13998亿元,平均保持着40%的年化增长率。同样地,公募基金配置该类ETF的仓位权重逐年增加,自2017年的0.04%增长至2023年的5.12%。 1.2.主动管理产品的超额收益逐渐减少,被动产品的优势逐渐显现 近年来主动管理的基金绝对业绩表现不佳,相对被动指数的超额衰减显著。同时因ETF交易费率低,能实现相较于主动管理基金更高频的策略(月度乃至周度),其优势明显。我们选取偏股混合型、普通股票型和灵活配置型基金为主动权益基金样本,以聚源对各个主动基金的行业划分统计(近三年、近两年和近一年)区间收益,求各板块内所有产品收益的平均值,与该板块指数同期收益比较(主动基金收益-板块指数收益)。截至2023年12月29日,左下图展示了前十板块主动基金的相对业绩统计,除基础化工板块和汽车板块外,其余板块的主动基金超额呈现明显的下降趋势,表明主动管理的难度不断加大,其相较被动指数化投资的优势逐渐缩小。同样地,我们测算了公募量化指增的(近三年、近两年和近一年)区间收益,结果中显示整体基金超额收益衰减明显,截面比较来说300指增的Alpha残留少,500和1000的Alpha受挤兑较明显。 图表5:主动权益基金的超额(相较指数)逐年递减图表6:近年来公募指数增强的超额收益同样衰减明显 资料来源:Ricequant,聚源,东证衍生品研究院资料来源:Ricequant,东证衍生品研究院 1.3.以自下而上的视角,构建截面打分的ETF轮动策略 从ETF的发行结构、存续产品类型和规模数据来看,若我们尝试构建ETF策略则需要解决三个核心问题, 1、第一个问题是如何在不断丰富的标的池中系统化筛选出有意义的目标对象。从ETF发行的产品类型来看,包括了股票型ETF、主题指数型ETF、规模指数型ETF、货币型ETF、商品ETF和跨境ETF等等。若简单地对所有标的建模,从策 略逻辑上来说,这会涉及到不同资产的周期性问题(时序策略)和不同资产收益率间的可比性问题(截面策略),从ETF产品规模来说,有部分规模较小的资产如货币型ETF会难以提供策略所需的流动性,所以本文我们仅聚焦于投资于股票资产的ETF产品。 2、第二个问题是在确定了股票资产的范围下,如何选择有效的交易逻辑以增厚权益资产表现。近些年来行业轮动、赛道投资和SmartBeta配置等投资逻辑在市场中已经逐渐成型,该类策略的投资标的均为主题指数ETF、行业指数ETF和风格指数ETF等。所以本文我们以同样的逻辑,剔除常见的宽基指数(规模指数ETF),选 择剩余标的作为目标变量池。 3、第三个问题是如何在跟踪同一指数的不同被动产品间进行抉择。由于ETF均为被动基金产品,不同基金管理人间均有着或大或小的跟踪误差且部分ETF产品的存续时间相对较短,所以更好地方法是以自下而上的视角对跟踪标的指数进行建模,再向上映射至(过去一段时间交易量最大或过去一段时间跟踪误差最小)ETF产品。从该投资视角来看,相较于时序周期预测(大类资产配置),更优的方法是横截面打分策略(截面多因子)。 图表7:以自下而上的视角,构建ETF策略的逻辑 资料来源:东证衍生品研究院 2.截面打分模型:变量选取、目标构造和深度学习模型 2.1.变量选取:成分股特征和指数行情特征 ETF标的指数与主动权益基金在持仓特征上具备共通性,均持有一揽子股票。前者较后者的优势在于持仓数据透明,因此我们选取变量时可从两个维度出发,一个是从个股经权重加权至指数层面,另一个是指数自身行情表征。在构建变量池时,我们从个股层面和指数层面出发尽可能地整理并计算了较多的因子值,下表中我们展示后续模型使用的66个因子池。因有效性筛选问题涉及目标变量的选取和时间参数的敏感性问题,本步骤暂时不考虑单因子有效性,在后续模型搭建过程中统一处理。 图表8:截面打分模型使用到的成分股因子和指数因子 资料来源:东证衍生品研究院 就个股层面特征,我们从指数层面下沉至其持仓,以个股的持仓权重加权因子,映射为该指数的单因子,其中因子选择大类以基本面因子为主