您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[西南证券]:量化视角下的转债配置策略:剑指何方? - 发现报告
当前位置:首页/其他报告/报告详情/

量化视角下的转债配置策略:剑指何方?

2023-10-20杨杰峰、谷岳洪西南证券李***
量化视角下的转债配置策略:剑指何方?

摘要 策略概述基于近五年的历史数据,建立中观行业景气轮动模型用于优选行业,并基于凯利公式在微观层面确认个券的时序配置。中观行业选择与微观标的配置上的一脉相承,提供了可持续、可实施的投资思路。 中观行业景气模型 参数选取以申万行业分类(2021版)作为分类依据,除“综合”行业未发行转债之外,对于余下的30个行业进行全面覆盖,采用共三大类九小类共计49个参数用于模型构建。 循环神经网络模型为兼顾参数数量与时间序列效果,选用循环神经网络(RNN)构建模型。经过充分训练,对于训练集实现15名正确率68.85%。 预测成果模型提示交通运输、石油石化、医药生物等行业可能迎来景气抬升。 其中石油石化、医药生物与Wind转债行业指数覆盖范围内本月涨跌幅位居第 二、第三名的能源、医疗保健基本吻合,均优于中证转债同期表现。 微观凯利配置模型 模型原理核心思想是确定每次投资的数额,以实现既要追求财富增长率最大化,又要避免因投资比例过高而损失本金离场。 回测结果在参与回测且触发了凯利模型的652只个券中,405只实现正超额收益,占比62.12%,平均年化正超额收益为30.40%;247只存在负的超额收益,平均年化负超额收益约有-18.67%。相对平均年化正超额收益明显较低,显示模型的突出性价比。 结论 历史回测基于中观行业模型与微观凯利模型提供的行业配置提示,我们在两种杠杆水平限制下分别对近五年来的历史情况进行回测。在不加杠杆时,采用凯利配置策略与等权重投资效果接近,但均明显优于转债表现;当限制杠杆上限不超过150%时,凯利配置策略相对于等权配置与中证转债,分别实现了2%与5%的年化超额收益。 未来预测预测模型提示,交通运输、医药生物、基础化工三个行业景气度或迎抬升且目前仓位较高,提示中度或重度配置仓位。 风险提示:数据统计误差,市场出现极端波动。 1策略概述 进入四季度,2023年进度条所剩无多。回望已过去的十月有余,“震荡”一词贯穿始终:开年以来,市场在疫后复苏进程中一路震荡上行,于五月初蹒跚到达3400点上方后随即掉头向下,七月份上攻3300点遗憾未能企稳,九月之后震荡下行至今,已回到最初的起点。 兜兜转转之中,转债的表现差强人意。尽管转债行情仍基本取决于大盘走势,但仍存在一定的相对收益。截至2023年10月13日,2023年中存续过的577只转债中,有331只取得正收益,平均收益9.00%;246只收益为负,平均收益-8.65%。这意味着,盲选一只转债持有,约有57%的概率在2023年内赚钱。在一定程度上体现转债的配置意义的同时,这也说明如不对标的加以筛选,预期胜率并不能令人满意。那么是否存在某种体系,能够在转债投资中获取更强的确定性呢? 图1:中证转债相对上证指数仍存相对收益 我们基于近五年的历史数据,建立了中观行业景气轮动模型用于优选行业,并基于在投资领域声名显赫的凯利公式在微观层面确认个券的时序配置。在宏观经济筑底复苏的大背景之下,我们的模型暂不对宏观经济背景进行多余的论述,而是希望尝试从中观的行业轮动以及微观的个券择时角度出发,共同给出上文问题的答案。 图2:自上而下投资体系的直观划分 中观的行业景气模型方面,我们聚焦行业中观数据,通过量化回归手段建立模型。梳理回顾全市场现有研究成果,对于行业景气轮动的探讨并不鲜见,但采用量化方式构建完整轮动模型的相对较少。 微观的凯利配置模型方面,本文在基于模型推导的基础上,进行合理的假设与发散,引入个券的实际数据,计算得出其理论最优投资仓位,解决转债投资中遴选标的、择时、投资比重等问题。业内对于凯利公式应用于权益市场已有研究,但由于模型参数特性所限等因素,将凯利公式应用于转债领域的观点仍较为稀缺。 本文创新性地将中观行业景气模型与微观标的配置模型相结合,实现中观行业选择与微观标的配置上的一脉相承,提供了可持续、可实施的投资思路,并为存在进一步择券需求的投资者提供了有价值的决策参考工具。 2中观行业景气模型 2.1参数选取 首先,我们以申万行业分类(2021版)作为分类依据。需要注意的是,现有数据中2021年之前的申万行业分类为2014版,我们依据申万宏源证券发布的《申万行业分类标准2021版说明》将2021年前的历史行业分类数据进行回溯,统一确认为2021年分类口径。在申万行业分类标准(2021版)共计31个行业中,除“综合”行业下近五年未发行过转债之外,模型对于余下的30个行业进行了全面覆盖。 表1:申万2021版行业分类列表 作为一个中观行业模型,我们尽量在中观范围内选取参数,以避免覆盖的参数超越中观范畴导致越俎代庖。经过综合考虑参数性质与更新频率,我们选取了三大类九小类共计49个参数用于模型构建。其中基本面指标主要涉及该行业的基本面状况。预测指标覆盖该行业的市场一致预期。转债特有指标则对于转债层面的成交情况加以考虑。模型涉及参数较多,下表列出具有部分具有代表性参数。 表2:中观行业景气模型部分参数 图3:基本面指标相关性 图4:预测指标相关性 图5:行情指标相关性 考虑到预测的时效性与实用性,我们希望以月度频率构建模型进行回归与预测。由于基本面数据普遍以季度频率更新,我们使用季频数据为当季度三个月进行赋值,将基本面数据加密到月度口径;对于日频更新的转债行情数据,我们通过平均或加总的方式将其调整为季度口径;值得注意的是,部分预测指标在2018年至2020年间有数据缺失的情况。为避免引入不必要的影响因素,我们采用该指标下全部数据的均值进行填充。 2.2循环神经网络模型 对于模型的输入与输出进行审视。尽管考虑模型的输入时已经避免涉及宏观层面,但模型仍需考虑包含基本面、市场预期、个券行情等在内的大量繁杂参数,此时简单的回归将面临诸如过拟合在内的许多问题;模型输出为各行业表现,亦或是行业景气程度的衡量。结合常识不难得知,行业景气程度往往呈现周期性波动,即存在明显的时间序列关系。而解决时间序列常用的自回归模型可能在捕捉长期的依赖关系上存在困难:对于高维的输入数据,自回归模型可能需要更多的样本来获得稳定的估计;自回归模型主要描述的是线性关系,对于非线性关系的处理效果不尽如人意。而神经网络模型对上述两个问题均有较好的表现。因此,我们选择了循环神经网络(Recurrent Neural Network, RNN)作为建模方法。 RNN是一种特殊的神经网络,它在序列数据上进行递归,每个节点都与前一个节点链式连接。由于这种结构,RNN的隐藏层不仅接收来自输入层的信息(用于本次预测的参数),还接收上一个隐藏层的输出(可近似理解为此前市场走势带来的经验)。这意味着RNN可以捕获到时间序列数据的特点,使其成为处理此类问题的理想选择。适用于当前场景下行业,动模型的构建。 我们以2018年10月至今,共计58个月的参数与各行业市场表现训练神经网络模型。 取57个月作为训练集,最后1个月作为测试集。经过160次训练(160 Epoch)后,模型对于训练集数据可实现预测前15名正确率68.85%。此时选用测试集检验模型效果,可实现预测前15名正确率60%,在当前情境的数据量限制下令人较为满意。 2.3预测成果 使用训练集数据对模型训练完毕后,尝试对于每个月的突出行业进行预测。此处以每月预测的首选行业为例,模型预测成果在多个月份取得突出成效。 表3:验证中观行业景气模型所预测的历史行业表现 我们尝试基于上述中观行业景气模型对于十月份的行业轮动结果进行预测。由于三季度基本面数据暂未更新,我们暂时使用二季度基本面数据替代,其余参数均采用9月最新数据。 预测结果如下表格所示。 表4:通过中观行业景气模型预测2023年10月份转债行业景气排名 图6:Wind行业系列指数2023年10月涨跌幅(截至2023年10月18日) 由于暂无完整的转债行业指数,此处使用Wind编制的行业转债指数验证模型预测准确性。即使Wind编制的行业转债指数并未全面覆盖全部行业,仍可发现,模型提示本月景气程度可能较高的石油石化、医药生物两行业与Wind转债行业指数覆盖范围内本月涨跌幅位居第二、第三名的医疗保健、能源基本吻合,且均低于月内中证转债跌幅。这提示,即使是在季度数据未能更新、部分参数采用过时数据的情况下,基于循环神经网络的中观行业景气模型仍然体现了一定的预测能力。待季度数据正常更新之后再进行预测,其预测结果准确性或可进一步提升。 3微观凯利配置模型 3.1模型原理 凯利公式由贝尔实验室的J.L.Kelly于1956年提出。值得一提的是,这一信息论的副产品,促使Kelly的同事——大名鼎鼎的信息论之父克劳德·香农——发现了投资的新大陆,并在35年内取得了年化28%的投资收益。凯利公式的最初目的是在一个期望净收益为正(获胜概率大于50%)的重复对局中,试图寻找倾向于确保财富最大化的投资技巧。其核心思想是确定每次投资的数额,以实现既要追求财富增长率最大化,又要避免因投入比例过高而输光本金离场。随后,这一公式由于其简洁实用的特性被广泛运用于金融投资甚至博彩等相关领域,以不同的形式为其使用者赚取财富。 凯利公式有两种较常用变体,分别基于伯努利分布与正态分布两种假设。伯努利分布下的凯利公式为两种常用模式中较为简单的一种。假设某人基于小道消息参加赛马,如果获胜可赢回一倍本金,输了则血本无归。在消息不完全可靠的情况下,他的获胜几率为𝑝,失败几率为1 − 𝑝,且已知𝑝>0.5。假设初始资本𝐶,每次投资比例为𝑘,𝑁次对局过后,假设此人的获胜与失败次数分别为𝑚、𝑛,此人的剩余财富应为: 𝑚 𝑛 ( 𝐶= 𝐶∗1+𝑘 ) ( )∗1−𝑘 𝑁 而要使财富最大化,应使其增长率取得最大值。对上式左右同除以𝐶再求导后可得: 𝑝 − (1 − 𝑝) − 𝑘𝑔′(𝑘) = (1 + 𝑘) ∗ (1 − 𝑘) 令导数为零时,财富增长率最大化,此时可解得: 𝑘 = 2 ∗ 𝑝 − 1 即,当投资比例为2 ∗ 𝑝 − 1,亦或说投资比例是获胜概率与失败概率的差值时,其财富值增长最快。 而本文所使用的凯利公式选用正态分布假设。假设某资产符合对数正态分布,期望收益率𝐸(𝑋) = 𝑚,收益率方差𝑉𝑎𝑟(𝑋) = 𝑠,起始资本𝐶,最优投资比例为𝑘,𝑟为无风险收益率,则投资后某一时点资本应为: ) ( ( ) ) 𝐶(𝑘= 𝐶 ∗𝑘 ∗ 𝑋 +1 − 𝑘∗ 𝑟 ( )) ( = 𝐶 ∗1 + 𝑟 + 𝑘 ∗𝑋 − 𝑟 基于这一表达式计算此时财富增长率并取期望,用𝑔(𝑘)表示,得到 𝑔(𝑘) = 𝐸(ln(1 + 𝑟 + 𝑘 ∗ (𝑋 − 𝑟))) 考虑该资产符合对数正态分布,结合上式,令上式导数等于零时,财富增长率最大,此时可解得: 𝑚− 𝑟𝑘 = 𝑠 此时,以𝑘作为投资比例,可取得财富增长率最大值。分子端为该风险资产相对无风险收益率的超额收益,超额收益越高,应进行越多配置;而风险资产的波动率越高,则更应该慎重对待。 从上式来看,仅有当转债超额收益为正数时,才具备投资价值,这与转债投资的实际情况有所出入——不同于权益类等收益来源相对单一的资产,影响转债价格的因素除转债本身基本面情况之外,其条款触发情况、正股价格变动均会对转债收益率有所贡献。通过对2018年10月至今存续过的800只转债进行日频涨跌幅与每日超额收益的Pearson相关性检验可知,绝大多数转债的收益率与其超额收益并不存在明确的相关性,或相关性为负值,比例达到97.50%。另有一只转债因上市时间过短暂时未纳入统计。 表5:近五年历史存续转债超额收益与收益率之间的相关关系检验结果 在此前提下,我们主张对上述模型进行微调。我们将上式中对于无风险收益率的系数修改为0.5,使得更多转债可以通过凯利公式进行实现配置,且不必担心调整超额收益门槛会拉低凯利公