一种高效的可转债择券路径 西南证券研究发展中心固定收益团队 2023年12月 模型简介:采用机器学习中性能优异、广受好评的XGBoost算法,通过构建决策树作为弱学习器,以集成学习手段,提升模型稳定性与准 确率,识别存在超额收益的转债标的。 模型训练:纳入条款特性、估值指标、行情指标三大类共计19个因子,以表现最为稳健的18个月训练窗口为长度建模;最近43个月中,模型可提供接近60%的预测正确率;基于当前最新模型,市场更关注债性估值指标。 策略建议:2020年5月至今,择券策略累计超额收益57.54%,年化超额收益16.12%,平均月超额收益1.34%,连续最长负超额收益时长不超过2个月;2023年内策略获取超额收益9.95%,累计9个月取得正超额收益。 风险提示:市场剧烈波动;模型失效;统计误差。 模型简介:基于决策树的XGBoost模型 模型训练:专注于挖掘相对收益 策略建议:稳中求胜 2023年存续转债收益情况 转债总数 取得正收益只数 平均正收益 取得负收益指数 平均负收益 595 287 10.60% 308 -9.31% 再次回顾全年个券表现: 120 数量 100 80 60 40 20 0 2023年存续转债收益分布 截至2023/12/01,全市场今年存续过的595只转债中,287只取得正收益,平均正收益10.60% 余下308只转债取得负收益,平均负收益-9.31% 如何捕捉结构性机会? 通过循环神经网络模型,选择潜在景气抬升行业 参见西南证券固收组2023年10月20日外发的报告 :《剑指何方?——量化视角下的转债配置策略》 如何提升择券胜率: 一种基于决策树的XGBoost模型 通过模型识别存在超额收益的转债标的 示例:使用决策树模型进行贷款审批 什么是决策树? 决策树从一系列数据中总结出决策规则,采用树状图的结构来提取与呈现决策规则,用来解决分类和回归问题 右图为使用决策树判断贷款审批问题的一个简单示例。通过三个问题对于申请人进行分类,基于分类结果得出决策 决策树模型有哪些提升方向? 模型过拟合: 决策树的“剪枝”——对于无关紧要或不符逻辑的决策逻辑进行精简与限制 结果不稳定: 集成学习——通过构建大量决策树(弱学习器)共同进行预测,投票得到最 优结果 …… XGBoost模型核心思想 什么是XGBoost? XGBoost(eXtremeGradientBoosting),当前火热的机器学习模型之一,在回归与分类场景下均有优秀性能表现 作为GBDT(GradientBoostingDecisionTree)的一种工程实现 ,与GBDT具有不同的目标函数定义,并具有正则化设置 核心思想 训练一棵树并进行预测,再训练一棵树去拟合上一棵树的预测残差,不断重复此过程 通过预先参数设置确定停止条件。对于某棵树而言,当引入新分支的增益低于阈值或达到决策树层数最大深度,停止该棵决策树的生长;当决策树总量达到预设数量,则完成模型构建 将每棵决策树的结果汇总,即为最终模型。对于给定测试集,将 每棵决策树的预测结果汇总即为模型的预测值 目录 模型简介:基于决策树的XGBoost模型 模型训练:专注于挖掘相对收益 策略建议:稳中求胜 6 数据范围数据范围2018年10月至2023年11月,以月度频率编制数据主要体现各因子周期中平均水平或周期末最新情况 解释变量 模型共计纳入19个因子主要包含条款特性、估值指标、行情指标三类特别包含了不常关注的下修及赎回动态 被解释变量 针对个券数据月份下一个月的月度表现确认被解释变量。全月表现跑赢市场记作1,跑输市场则记为0 模型因子一览 因子分类 特征因子 处理口径 条款特性 余额 月末最新 条款特性 未转股比例 月末最新 条款特性 剩余期限 月末最新 条款特性 行业 月末最新申万行业一级分类 条款特性 下修 当月下修结果及月末最新触发预期 条款特性 赎回 月末最新触发预期 估值指标 纯债到期收益率 月末最新 估值指标 转股溢价率 月末最新 估值指标 转股市净率 月末最新 估值指标 纯债溢价率 月末最新 估值指标 转股市盈率 月末最新 估值指标 隐含波动率 月末最新 行情指标 最高价 当月最高价/月初开盘价 行情指标 最低价 当月最低价/月初开盘价 行情指标 当月涨跌幅 月末收盘价/月初开盘价 行情指标 成交额 当月累计成交额占全市场 行情指标 转债换手率 转债当月平均换手率 行情指标 正股换手率 正股当月平均换手率 行情指标 正股涨跌幅 正股月末收盘价/月初开盘价 以多久作为训练时间窗口效果最优? 尝试各个训练窗口时长设置,寻找最优选择 各时间窗口训练表现: 以6个月的整倍数为训练窗口,训练表现随窗口长度增加呈抛物线状 过短或过长的训练窗口效果均不佳:6个月窗口在最初阶段表现最优,但长期来看表现最差;最长的48个月窗口表现持续较差 12至36个月窗口表现均较为稳健;18个月窗 口表现在多数时段表现最优 近一年各时间窗口训练表现 1.12 1.1 1.08 1.06 1.04 1.02 1 0.98 0.96 6个月12个月18个月24个月30个月36个月42个月48个月 如何解释不同时间窗口的表现差异? 时间窗口选择需要在更多的信息与市场风格转变之间抉择 时间窗口越长,模型对历史数据把握越好 时间窗口越短,模型对市场转变反应越快 市场转变前后显著的因子差异: 以2022年1月为分界线,2022年1月之前模型影响因子较为平均;2022年1月及之后纯债溢价率影响极为突出,其余因子重要程度则被摊薄 2022年第一季度至今,中证转债长期上行趋势转为 震荡,转债市场转为主要由债市行情驱动 12% 10% 8% 6% 4% 2% 0% 460 440 420 400 380 360 340 2020-05 2020-06 2020-07 2020-08 2020-09 2020-10 2020-11 2020-12 2021-01 2021-02 2021-03 2021-04 2021-05 2021-06 2021-07 2021-08 2021-09 2021-10 2021-11 2021-12 2022-01 2022-02 2022-03 2022-04 2022-05 2022-06 2022-07 2022-08 2022-09 2022-10 2022-11 2022-12 2023-01 2023-02 2023-03 2023-04 2023-05 2023-06 2023-07 2023-08 2023-09 2023-10 2023-11 320 近一年各时间窗口训练表现 2022年1月之前2022年1月及之后 数据期内中证转债走势 100% 模型预测表现 模型训练过程: 以18个月为时间窗口滚动训练。即使用T-18至T-1个月的历史 数据训练模型,基于T月数据预测T+1个月的表现 多次尝试进行模型参数调优 模型训练初步效果: 50% 使用模型基于历史数据进行预测,取模型预测相对表现最好的前30只转债,与实际历史行情对比,逐月计算当月预测标的中表现优于市场的比例 2020年5月至2023年11月的43个月中,29个月份的预测正确率 高于50%,平均正确率59.76% 0% 2023年初至今的11个整月中,有10个月份的预测正确率高于50%,平均正确率68.79% 最新模型影响因子重要性 10% 9% 8% 7% 6% 5% 4% 3% 2% 1% 0% 当前市场哪些因子对于标的表现有 突出作用? 当前最重要因子仍为纯债溢价率;纯债到期收益率影响亦位居前列 相对而言,转股溢价率重要程度稍差 ,提示当前转债市场底层逻辑或仍以 债市行情推动为主 成交额、换手率、当月涨跌幅等行情 指标重要性突出 下修、赎回状态指标亦有一定权重 正股表现影响则相对较弱 转债最高价 4.50%4.00%3.50%3.00%2.50%2.00%1.50%1.00%0.50%0.00% 策略 未选出 全市场 转债成交额 0.25%0.20%0.15%0.10%0.05%0.00% 策略 未选出 全市场 转债最低价 0.00%-0.50%-1.00%-1.50%-2.00%-2.50% 策略 未选出 全市场 转债换手率 20.00%18.00%16.00%14.00%12.00%10.00%8.00%6.00%4.00%2.00%0.00% 策略 未选出 全市场 转债涨跌幅 0.06%0.04%0.02%0.00% -0.02%-0.04%-0.06%-0.08% 策略 未选出 全市场 正股涨跌幅 6.00%5.00%4.00%3.00%2.00%1.00%0.00% 策略 未选出 全市场 因子的作用方向——行情指标: 纯债溢价率 因子的作用方向——估值指标: 纯债到期收益率 转股溢价率 20.00%6.00%18.00% 5.00% 16.00%14.00%4.00%12.00%10.00%3.00% 8.00% 2.00% 6.00%4.00%1.00%2.00%0.00%0.00% 策略未选出全市场策略未选出全市场 转股市盈率 隐含波动率 转股市净率 35.00% 30.00% 4.00% 2.00% 25.00% -2.00% 60.00% 20.00% -4.00% 50.00% 15.00% -6.00% 40.00% 0.00% 90.00% 80.00% 70.00% 0.25% 0.20% 0.15% 0.10% 0.05% 0.00% 策略 未选出 全市场 10.00% 5.00% 0.00% 策略 未选出全市场 -8.00% -10.00% -12.00% -14.00% 策略未选出全市场 30.00% 20.00% 10.00% 0.00% 策略 未选出全市场 因子的作用方向——条款特性: 最新余额 18亿元16141210 86420 策略未选出全市场 剩余期限 4年 3.532.521.510.50 策略未选出全市场 未转股比例 92.50%92.00%91.50%91.00%90.50%90.00%89.50%89.00%88.50% 策略 未选出 全市场 下修预期 100% 未选出已下修+无触发初期 80%60%40%20% 0% 策略 全市场 已下修+有触发初期 有触发预期 无触发预期 目录 模型简介:基于决策树的XGBoost模型 模型训练:专注于挖掘相对收益 策略建议:稳中求胜 15 择券策略历史回测表现优异: 择券策略历史回测 2020年5月至2023年11月,累计超额收益57.54%;年化超额收益16.12%;2023年内获取超额收益9.95% 65% 1.9 55% 1.7 45% 1.5 35% 25% 1.3 15% 1.1 5% 0.9-5% 超额收益(右轴)策略净值(左轴)中证转债指数(左轴) 择券策略月度表现较为稳健: 2020年5月至2023年11月的43个月中,择券策略平均月超额收益1.34%,最长连续负超额收益时长不超过2个月;年内11个月中,累计9个月取得正超额收益 择券策略月度表现 1.9 1.7 1.5 0.08 0.07 0.06 0.05 0.04 1.3 1.1 0.03 0.02 0.01 0 0.9 -0.01 0.7-0.02 当月超额收益(右轴)策略净值(左轴)中证转债指数(左轴) 12月最新择券结果(部分): 代码 简称 行业 转股溢价率 纯债溢价率 本月至今涨跌幅 123104.SZ 卫宁转债 计算机 164.55% 1.96% 1.22% 123064.SZ 万孚转债 医药生物 78.86% 7.