金融工程专题报告 撰写日期:2022年11月29日 证券研究报告--金融工程专题报告 主动暴露的得与失—从Barra框架到私募指增因子分析方法 金融工程专题报告 分析师:李亭函 执业证书编号:S0890519080001电话:021-20321017 邮箱:litinghan@cnhbstock.com 研究助理:张帅邮箱: zhangshuai564576@cnhbstock.com 销售服务电话: 相关研究报告 021-20515355 1《金融工程:如何将PB_ROE模型用于行业轮动?-量化视点2022年第14期》 2022-11-21 2《金融工程:寻找具备“反脆弱”能力的主动权益基金-FOF策略专题》2022-10-243《金融工程:如何将价值成长风格轮动用 于指数化投资?-量化视点2022年第13期》 2022-09-26 ◎投资要点: 对于私募指数增强产品来说,指数本身的风险是一种被动的且必需的暴露,因此风险因子对指数的主动暴露成为了一种调节工具,一方面对应着选股模型的能力特点,一方面也掺杂着私募机构的主观判断。本文针对私募指数增强产品的策略流程,设计了一套相应的风险因子暴露分析方法,在数据匮乏的情况下取得了良好的效果,打开了从风险暴露的角度构造因子对私募指数增强产品进行分析的道路。 在敞口暴露因子的分析过程中,本文发现总体上大的风格敞口暴露和小的行业敞口暴露会导致指数增强产品较差的收益表现。这说明在带有主观色彩的风格因子控制中,过度放大敞口会侵蚀产品的净值;在相对统一的行业因子控制中,过严的敞口约束会削弱收益的贝塔来源。 在敞口反转因子的分析过程中,本文发现沪深300指数增强产品的业绩延续性最强,业绩较差的产品无法通过风格和行业的敞口大幅调整来实现净值的追赶,反而会导致更差的结果,但是对中证500和中证1000来说没有明显差别。这与沪深300指数增强策略中基本面因子的比例更高有关。相比量价因子,不同私募基金在基本面因子上的挖掘效果差异较大,并且基本面因子需要依靠人工挖掘,更新迭代周期较慢,而量价因子的失效和迭代周期更快,敞口上的变化一定程度反映了策略的更新迭代。 在对风险轮动因子的分析中,本文得到了敞口反转因子中一致的结果。沪深300指数增强产品的业绩延续性更强,一部分原因表现在优秀的沪深300指数增强产品具有风格和行业的轮动能力,但是在中证500和中证1000的竞争格局中,这种优势不太明显。经过测试发现,在业绩统计筛选方法中加入风险轮动因子可以显著提升沪深300指数增强产品筛选组合的收益表现,其中加入风格轮动因子后组合年化超额收益从15.6%提升到了23.5%,超额最大回撤从6.2%下降到了5.5%。 风险提示:本报告主要采用数量化研究方法,可能存在模型设定偏差。 内容目录 1.私募指数增强策略流程简介4 1.1.因子挖掘5 1.2.模型加权5 1.3.组合优化6 2.私募指数增强策略风险暴露分析方法6 2.1.方法介绍7 2.2.结果展示8 3.私募指数增强策略风险暴露实战应用10 3.1.主动暴露因子10 3.2.风险轮动因子14 4.结论17 图表目录 图1:股票策略分类4 图2:私募指增、中性产品每季度发行数量4 图3:私募指数增强策略开发流程图5 图4:私募指数增强策略模型加权过程6 图5:传统风格因子与Barra风格因子7 图6:沪深300指数增强产品风格超额暴露8 图7:沪深300指数增强产品行业超额暴露8 图8:中证500指数增强产品风格超额暴露9 图9:中证500指数增强产品行业超额暴露9 图10:中证1000指数增强产品风格超额暴露9 图11:中证1000指数增强产品行业超额暴露9 图12:沪深300指数增强产品风格敞口暴露因子10 图13:沪深300指数增强产品行业敞口暴露因子10 图14:中证500指数增强产品风格敞口暴露因子10 图15:中证500指数增强产品行业敞口暴露因子10 图16:中证1000指数增强产品风格敞口暴露因子11 图17:中证1000指数增强产品行业敞口暴露因子11 图18:沪深300指数增强产品风格敞口反转因子12 图19:沪深300指数增强产品行业敞口反转因子12 图20:中证500指数增强产品风格敞口反转因子13 图21:中证500指数增强产品行业敞口反转因子13 图22:中证1000指数增强产品风格敞口反转因子13 图23:中证1000指数增强产品行业敞口反转因子13 图24:沪深300指数增强产品风格轮动因子15 图25:沪深300指数增强产品行业轮动因子15 图26:中证500指数增强产品风格轮动因子15 图27:中证500指数增强产品行业轮动因子15 图28:中证1000指数增强产品风格轮动因子15 图29:中证1000指数增强产品行业轮动因子15 图30:沪深300指数增强产品业绩筛选+风格轮动因子17 图31:沪深300指数增强产品业绩筛选+行业轮动因子17 表1:风险因子暴露回归判定系数8 表2:风格敞口暴露因子回测结果11 表3:行业敞口暴露因子回测结果11 表4:风格敞口反转因子回测结果13 表5:行业敞口反转因子回测结果14 表6:风格轮动因子回测结果16 表7:行业轮动因子回测结果16 表8:沪深300指数增强产品业绩筛选+风险轮动因子回测17 如何从股票市场中获取收益是人们一直探索的方向,经典的CAPM模型将股票收益拆解为Alpha和Beta两部分,由此衍生出了两类策略,一是消除市场影响、彰显主动管理能力的纯Alpha策略,如股票市场中性策略和T0策略,策略呈现出与市场较低的相关性,但收益稳定性较好,收益风险比较高;二是站在市场的肩膀上顺势而为的Beta+策略,如指数增强策略和SmartBeta策略,这类策略与指数表现出高度相关性,但同时也能获得相对于指数额外的收益。 在私募市场中,股票市场中性策略和指数增强策略依托于股票市场,策略容量相对充足,方法论比较成熟,收益特征也能满足不同投资者的风险偏好,因此成为各机构广泛布局的策略基石。具体来看,二者主要区别在于股票市场中性策略需要对冲市场的Beta影响,常见的方法包括做空股指期货、ETF融券、期权合成期货等,这就带来了两个问题:一是对冲需要占用一定的资金,会影响组合资金的使用效率,二是对冲需要付出额外的成本,会降低策略的收益表现,而指数增强策略规避了这些困扰,同时还具备Beta属性,在市场上涨时收益弹性更大,成为了量化私募市场发展最快的策略之一。 图1:股票策略分类图2:私募指增、中性产品每季度发行数量 800指数增强股票市场中性 700 600 500 400 300 200 100 0 资料来源:华宝证券研究创新部资料来源:华宝证券研究创新部,私募排排网 在私募基金研究中,可获得的数据较为稀缺,相比公募基金会对持仓数据进行定期公布,私募基金能够拿到的数据就少之又少,甚至净值数据都是残缺不全的,需要靠调研来进行定性的补足,不过对指数增强策略进行定量研究仍然有迹可循。指数增强策略作为量化多头的代表,大多公司采用了相似的流程和框架,虽然在数据披露上不规范,但数量上浩如烟海,因此只要处理得当就可以发挥量化研究在广度上的优势,通过定性与定量相结合,提高我们对私募市场指数增强策略的认识。 风格与行业分析是对股票类金融产品研究的基本方法,也是私募指数增强策略量化研究首当其冲的问题,公募基金对此可以从持仓股票进行底层合成,私募基金则需要对净值曲线进行加工。本文从私募市场指数增强策略的框架开始,介绍了对私募指数增强产品风格以及行业暴露的分析方法,希望打开对私募标准量化研究的通道。随着投资理念发展,因子已经不再局限于对底层资产的描绘,对大类资产和金融产品的因子化投资大行其道,本文基于风格以及行业暴露分析方法,对私募指数增强产品构造了三个简单的因子,希望从因子角度提供对私募指数增强产品更多的观察维度。 1.私募指数增强策略流程简介 私募市场中的指数增强策略虽然在细节上各有不同,但基本都以多因子选股为整体框架,依照因子挖掘-寻找股票代理信息、模型加权-形成股票预期收益、组合优化-确定股票最终权重的流程运作。 图3:私募指数增强策略开发流程图 资料来源:华宝证券研究创新部 1.1.因子挖掘 因子是用于预测股票收益的变量,可以分为基本面因子、量价因子和另类因子三大类,具体含义和特征如下: 基本面因子主要采用财务指标构建,还包括分析师一致预期数据,由于财务指标在季度财报中才会披露,因此基本面因子平时变化不大,在财报季会驱动形成大量交易。基本面因子追求的是股票的价值回归,总体偏向左侧交易。 量价因子利用股票的交易信息生成,可以分为人工量价因子和机器量价因子两类,前者从实际逻辑出发,数量较少;后者利用遗传算法、深度学习等自动挖掘,可以批量生成。由于高频数据相比低频数据包含了更多信息,目前量价因子已经发展到利用Level2逐笔成交数据进行构建。量价因子捕捉的是股票的定价错误,总体偏向右侧交易,衰减和失效也更快。 另类因子对新闻舆情、网站搜索结果等进行加工,往往需要利用爬虫抓取数据,大规模采用自然语言处理,目前整体数量有限,是基本面和量价因子日渐拥挤之后扩充信息来源的有效途径。 1.2.模型加权 将不同因子加权的方式可以分为线性模型和非线性模型两大类。其中线性模型结构简单,拟合能力差但是可解释性高,不容易过拟合;非线性模型拟合能力好,但是作为一个黑箱可解释性差,容易产生过拟合。 等权模型是最简单的线性模型,此外IC加权、IC_IR加权,最大化复合IC_IR加权也是常见的线性加权方式。IC加权取每个因子过去一段时间的IC均值作为权重,IC_IR加权取每个因子过去一段时间IC均值除以标准差作为当期因子的权重,最大化复合IC_IR加权计算合成因子的IC和标准差,以最大化复合IC_IR为目标。 非线性模型以各类机器学习模型为代表,常见非线性模型可以分为树类模型和神经网络类模型两大类。随机森林和Xgboost是最常见的树类模型,对应了决策树在Bagging和Boosting两个维度的集成提升。神经网络类模型包括卷积神经网络、循环神经网络等,对单个因子质量要求不高,十分适合对同质弱信号的特征提取,如原始量价数据、机器批量挖掘的因子等。 在实际应用过程中不会依赖某个因子,一般也不会单独使用某个模型,最终的预测信号是不同种类、不同参数模型的组合。 图4:私募指数增强策略模型加权过程 资料来源:华宝证券研究创新部 1.3.组合优化 如果把因子挖掘类比于食材的寻找,模型加权则是对食材的加工,那么组合优化就像是最后的塑形和摆盘。组合优化一般会对成本交易进行约束,狭义的交易成本模型指要求交易收益高于交易成本,一般适用于高频交易中对交易信号的筛选,而广义的交易成本模型对换手率进行限制;风险模型以Barra风险因子为基础,是私募指数增强策略广泛使用的风险约束框架。风险模型与交易成本模型以及其他主观约束、客观约束共同构成了一个凸优化问题,可以写作: max𝑤′�−𝜆𝑤′∑�(1.1) |�−𝑤0|<�(1.2) 𝑠.𝑡.[ 𝑤𝑚𝑖�<�<𝑤𝑚𝑎�(1.3) 𝑓𝑚𝑖�<𝑋�<𝑓𝑚𝑎�(1.4) … 优化目标(1.1)以最大化均值-方差效用函数为例,公式中w代表股票权重向量,r代表预测收益率,∑为股票收益的协方差矩阵。(1.2)代表换手率的约束,(1.3)代表单一股票的权重约束,(1.4)代表对组合风险暴露的约束,X为股票Barra风险因子暴露度矩阵,Barra风险因子包括30个中信一级行业因子和10个风格因子。 本文主要研究组合优化中的风险模型,风险模型对于指数增强策略的作用体现在:首先可以控制组合的行业和风格与指数接近,收益表现也与指数本身保持类似节奏,以符合策略本身的目的;其次避免持仓过于集中,分散风险;此外还可以根据对未来的预期实现对指数的主动偏离。 2.私募指数增强策略风险暴露分析方法 风险