可转债多因子模型初探 ——宏观固收量化研究系列之(十) 研究结论 随着中国转债市场的逐步扩容,越来越多的投资者开始关注量化模型在可转债这一品种上的适用性。本报告借鉴股票领域的多因子模型,对中国可转债市场进行尝试。 本报告测试了转债估值、正股量价和转债量价3个大类的单因子,其中,转债估值因子侧重于对转债期权价值的定价,正股量价因子侧重于转债所对应的正股的量价关系对转债价格行为的影响,包括正股动量类因子、正股量价结合因子、正股转债结合因子,转债量价因子侧重于转债自身作为一个交易品种的价格规律,包括基于 金融工程|专题报告 报告发布日期2023年07月01日 证券分析师杨怡玲 yangyiling@orientsec.com.cn 执业证书编号:S0860523040002 联系人宋之辰 songzhichen@orientsec.com.cn 日频的量价因子和基于转债日内分钟线的量价因子。 转债估值类因子中,较为常见的双低因子、隐含波动率因子、隐波差因子具有较好的表现,同时这些因子的时序Zscore因子也具有稳健的预测能力,这些因子分别从绝对估值水平、时序的相对位置的角度捕捉转债的低估程度。 正股量价类因子中,正股的简单动量效果并不稳健,其他刻画动量的PercentB、RSI、PriceToHigh技术因子效果更佳,而结合成交量的Amihud因子和MFI指标也表现较好。同时,转债与正股涨跌幅之差的因子也展现了较好的预测能力,方向上呈现出反转效应。 转债量价类因子中,转债日频的量价因子在分组收益和秩相关性上均不如正股的量价因子,而基于转债分钟线数据所生成的一系列量价因子具有较高的多头超额收益,转债日内的价格动量、价格波动、成交量变化的分布、开盘成交量占比等因子均在多头上表现较好。 综合考虑各项指标,本文最终选取42个样本区间表现较好的单因子构建多因子得分,采用“组内等权&大类等权”和“组内对称正交化后等权&大类等权”2种方法合成最终的因子得分。两种合成因子分别取得6.52%、6.67%的RankIC均值,IC_IR达0.51和0.5,IC胜率均达70%以上,因子多头年化超额收益率分别达10.38%、10.07%,信息比率达2.77、2.7,多空收益达19.30%、17.94%。 我们还对偏股型、偏债型和平衡型的转债样本分别做了测试,结果表明,合成因子在不同股性和债性的转债样本均有较高的超额收益和信息比率。 基于合成因子得分,我们构建了两类多因子择券策略: TOPN组合,每期选择因子得分最高的N个转债 类型平衡组合,每期选择偏股/偏债/平衡3种类型的转债里面因子得分最高的 N个转债等权,并按照3种类型在样本池中的分布权重构建最终组合 回测表明,在买入和卖出成本均设置为千分之1.5的设定下,TOPN组合(N=30)的年化收益达22.26%,年化超额收益率达11.18%,信息比率达1.61。类型平衡组合(N=20)的年化收益达17.40%,年化超额收益率达6.72%,信息比率达1.39。 风险提示 量化模型失效的风险 市场极端环境的冲击 基于神经网络模型的利率择时:——宏观固收量化研究系列之(九) 基于量价信息的利率择时探讨:——宏观固收量化研究系列之(八) 债券的风险模型研究:——宏观固收量化研究系列之(七) 2023-03-12 2022-12-13 2022-09-03 有关分析师的申明,见本报告最后部分。其他重要信息披露见分析师申明之后部分,或请与您的投资代表联系。并请阅读本证券研究报告最后一页的免责申明。 目录 一、研究背景5 二、模型设定6 2.1多因子模型简介6 2.2可转债多因子框架设定7 1)样本池7 2)因子数据预处理7 3)因子评估7 三、单因子评估8 3.1转债估值类因子8 3.2正股量价类因子10 1)正股动量类因子10 2)正股量价结合因子12 3)正股转债结合因子13 3.3转债量价类因子15 1)转债日频量价因子15 2)转债分钟线量价因子16 四、因子合成与策略组合21 4.1因子合成21 4.2多因子组合策略表现24 1)TOPN组合24 2)类型平衡组合26 五、结论28 风险提示28 图表目录 图1:可转债的属性示意图5 图2:中国可转债市场规模6 图3:“双低”的分组超额收益率9 图4:“转股溢价率6个月时序ZScore”的分组超额收益率9 图5:“隐波差”的分组超额收益率9 图6:“隐波差的6个月时序Zscore”的分组超额收益率9 图7:转债与对应正股的滚动60日相关系数的分类型均值10 图8:“正股近60日涨跌幅”的分组超额收益率11 图9:“正股近60日涨跌幅的6个月时序ZScore”的分组超额收益率11 图10:“正股60日PercentB”的分组超额收益率12 图11:“正股60日PriceToHigh”的分组超额收益率12 图12:“正股120日Amihud”的分组超额收益率13 图13:“正股60日MFI”的分组超额收益率13 图14:“近5日转债正股涨跌幅之差”的分组超额收益14 图15:“近20日转债正股涨跌幅之差”的分组超额收益率14 图16:“近5日转债换手率”的分组超额收益15 图17:“近20日转债换手率”的分组超额收益率15 图18:“近5日日内5分钟线RSI”的分组超额收益率17 图19:“近10日日内5分钟线RSI”的分组超额收益率17 图20:“近10日温和收益均值”的分组超额收益率17 图21:“近20日温和收益均值”的分组超额收益率17 图22:“近10日日内分钟线收益率方差”的分组超额收益率18 图23:“近20日日内分钟线收益率方差”的分组超额收益率18 图24:“近10日日内5分钟线量价相关系数波动率”的分组超额收益率20 图25:“近20日日内5分钟线量价相关系数波动率”的分组超额收益率20 图26:“近60日日内分钟线成交量变化偏度”的分组超额收益率20 图27:“近120日日内分钟线成交量变化偏度”的分组超额收益率20 图28:“近20日开盘成交占比”的分组超额收益率20 图29:“近60日开盘成交占比”的分组超额收益率20 图30:“组内:等权&大类:等权”的RankIC22 图31:“组内:对称正交化后等权&大类:等权”的RankIC22 图32:“组内:等权&大类:等权”的分组超额收益率22 图33:“组内:对称正交化后等权&大类:等权”的分组超额收益率22 图34:“组内:等权&大类:等权”的top和bottom组超额收益率22 图35:“组内:对称正交化后等权&大类:等权”的top和bottom超额收益率22 图36:偏股型样本的分组表现23 图37:偏债型样本的分组表现23 图38:平衡型样本的分组表现24 图39:组合策略净值25 图40:TOP30组合累计超额收益率表现26 图41:类型平衡组合策略净值27 图42:类型平衡组合(N=20)累计超额收益率表现28 表1:转债估值因子的表现8 表2:转债估值时序ZScore因子的表现9 表3:正股动量因子的表现11 表4:正股量价结合因子的表现13 表5:正股转债结合因子的表现14 表6:正股与转债的时序相关性因子的表现14 表7:转债日频量价因子的表现15 表8:转债日内反转因子的表现16 表9:转债日内波动因子的表现18 表10:转债日内成交量因子的表现19 表11:最终选取的单因子列表21 表12:合成因子表现22 表13:合成在不同转债类型样本的表现23 表14:TOPN组合策略表现25 表15:TOPN组合分年度表现25 表16:类型平衡组合策略表现26 表17:类型平衡组合分年度表现27 一、研究背景 可转债是一种具有转股权利的公司债券,其持有者有权选择在存续期内将全部或部分转债转换成发行公司的普通股票,因此可转债兼具股性和债性,如下图所示: 图1:可转债的属性示意图 资料来源:东方证券研究所 从可转债的债性维度来看,可转债可看做纯债价值和纯债溢价之和。纯债价值是指不考虑转股权权益及其他附加条款的情况下可转债未来所有现金流的折现价值,即通常所说的债底。可转债在未来到期时,如果不转股成为股票,而是按照债券的面值偿还,则债券持有人可以至少获得债券的债券面值作为回报,因此纯债价值可以看做是可转债的保底价值。纯债溢价是指可转债的市场价格相对于其纯债价值的溢价情况,即作为一张可转换为股票的债券所具有的附加价值。代表投资者购买可转债时相对于纯债需要支付的额外费用。 从可转债的股性维度来看,可转债可看成平价和转股溢价之和。平价指的是可转债按照发行人发行时规定的转股比例和转股价兑换成股票后的转股价值。转股溢价是可转债的市场价格相对于其转股价值的溢价情况,表示投资者愿意为这种转换权利而非直接购买标的正股所付出的溢价。 2017年以来,中国可转债市场呈现高速增长趋势,转债数量和规模逐年上升,目前已成为中国资 本市场的重要组成品种。截至2023年5月底,沪深两市的可转债余额达8563.17亿元,存续可 转债数量达512只。 图2:中国可转债市场规模 资料来源:东方证券研究所&Wind资讯 随着转债市场容量的扩张和转债交易的日渐活跃,越来越多的投资者开始关注使用量化的投资方法来分析和选取可转债。由于可转债与股票有较多相似的地方,因此股票领域的多因子模型是一种潜在的可以借鉴的投资模型。本文希望基于可转债估值、正股量价以及转债量价等数据,挖掘出更多与转债未来收益有强相关性的因子,并通过将有效的因子组合成为一个最终得分,从而得到一个对转债未来收益的预测或收益排序的预测。 二、模型设定 2.1多因子模型简介 多因子模型的理论基础可以追溯到套利定价理论(ArbitragePricingTheory,简称APT),该理论最早由StephenRoss(1976)提出。套利定价理论是一种资产定价理论,旨在解释资产回报差异的来源,并基于市场的套利机会来确定资产的合理价格。 根据套利定价理论,市场中的投资者会寻求利用无风险套利机会来获得超额收益。这些套利机会源于资产的定价偏离其合理价值,因此投资者通过交易这些被低估或高估的资产来实现风险调整后的回报。套利定价理论认为,在市场不存在风险套利机会的情况下,风险资产的预期回报应该与一组风险因素相关联,并且这些回报与各个因素之间存在线性关系: 𝑅�=𝑎�+𝑏𝑖,1𝐹1+𝑏𝑖,2𝐹2+⋯+𝑏𝑖,𝑘𝐹�+𝜖� 这些风险因素可以是宏观经济因素,也可以是公司特定因素,也可以是市场上的交易情绪因素。多因子模型的核心在于识别出那些与资产回报显著相关的因子,并利用它们来解释和预测资产的回报。 通过多因子模型,投资者可以构建一个包含多个因子的投资组合,并根据各个因子的权重对资产进行定价和评估。通过调整不同因子的权重和组合,投资者可以根据自身的投资目标和风险偏好来构建投资组合,以追求超额收益或降低风险。多因子模型的应用可以帮助投资者更全面地理解资产回报的来源,识别出有价值的投资机会,并优化投资组合的风险收益特征。 2.2可转债多因子框架设定 1)样本池 基于收益稳健性、流动性和可投资性的考虑,本文采取双周度的调仓频率,每期对全市场的转债进行如下筛选,最终确定下来多因子研究的样本池: 剔除上市不超过10个交易日的转债; 剔除近1个月换手率超过100%的转债; 剔除余额低于2亿的转债; 剔除主体评级低于A的转债 测试时间选定为2018年1月1日至2023年6月21日。 2)因子数据预处理 本文所用到的转债有关基本信息、行情和因子数据均来自于Wind资讯,对于因子数据,我们进行如下的预处理: 缺失值处理:对因子值有缺失的转债按照所属中信一级行业的中位数填充; 去极值:采用MAD法去极值,将对于超过3倍绝对中位数范围的数据判定为极值,并将其均匀插值到3-3.5倍绝对中位数范围内; 中性化与标准化:传统股票多因子模型中,比较常见的做法是对股票的市