作者:孙晨童、陈浩川 邮箱:research@fecr.com.cn 基于混合模型框架的债券违约预警研究 摘要 本文是“债券违约预警与主动评级系统研究”的阶段性成果。为了兼顾模型的预测精度和可解释性,我们采用了机器学习中的Lasso模型与逻辑回归(Logistic回归)模型的混合框架来进行债券违约预警。 整个框架设计包含三个关键模块: 一是,评分模块,对发债主体的非财务定性指标与财务定量指标进行打分。 二是,量化违约预警模块,该模块主要包括机器学习和逻辑回归两个子模块。其中,机器学习子模块,将债券是否违约作为被解释变量,利用Lasso模型进行特征选择和降维,筛选出对债券违约有显著影响的解释变量;逻辑回归子模块,使用筛选出的解释变量,通过排列组合和逐步迭代的方式,将其带入Logistic模型中进行估计,选择出预测精准度最优的解释变量组合,并将相应的参数估计结果作为最终模型形式。 三是,违约概率输出模块,基于最终确定的Logistic模型形式,输出测试样本的违约概率。 整个框架具有动态调参的能力,可以根据样本变化进行实时优化,为未来嵌入文本分析、信用画像评价、主动评级及大语言模型等多个模块提供了坚实的基础。 一、引言 在防范化解重大金融风险中,企业债务违约是一个被重点关注的问题。随着我国债券市场的不断壮大,发债已经成为企业直接融资的重要渠道。然而,2014年,随着“11超日债”未能按时全额兑付利息,我国债券市场“刚兑”被正式打破。自此,我国债券违约事件频发,违约数量和规模不断扩大,债券违约风险已经成为我国金融市场中不可忽视的重大风险点之一。因此,研究债券违约的影响因素以及有效预警债券违约风险成为了金融领域亟待解决的问题。 近年来,金融科技快速发展,尤其是大数据、人工智能以及机器学习等技术的应用,为债券违约风险的预测和管理提供了新的视角和工具。通过整合和分析大量企业财务数据、市场信息可以构建更为精准的债券违约概率预警模型。这不仅能够帮助投资者做出更为明智的投资决策,降低投资风险,同时也能够帮助企业及时发现潜在的违约风险,采取相应措施进行风险规避。 已有研究表明,机器学习方法在债券违约预测中具有较高的预测精度,但其算法的“黑箱”特性往往缺乏可解释性。传统计量回归模型虽然解释性强,但预测精度通常不及机器学习方法。为此,本文试图构建一个结合机器学习和传统计量回归的混合模型框架,以提高预测精度的同时确保模型的可解释性。通过这一框架的实现,我们致力于为债券市场的参与者提供更有效的信用风险管理工具。 二、技术路线 整个框架除了定性指标打分环节需要人工介入外,其余环节均采用Python编程实现。建模的技术路线可以分为五个步骤: 第一步,收集自2014年以来债券市场的违约样本企业,并按照一比一的比例收集相似的正常样本企业(未违约样本)。搜集样本的年报与财务指标数据,对所有样本的定性指标和定量指标进行打分。 第二步,将违约样本和正常样本按照3比1的比例随机划分为训练集(75%)和测试集(25%)。 第三步,利用训练集建立机器学习的Lasso模型,筛选出对债券违约有显著影响的定性和定量指标。 第四步,基于Lasso模型筛选出的解释变量,通过排列组合构建Logistic回归模型。记录每个解释变量组合的参数估计结果与预测精确度,并进行穷举迭代,选择预测精度最优的解释变量组合作为最终的Logistic回归模型结果。 第五步,基于最优的Logistic回归模型形式,对测试样本分别计算预测违约概率。 图1技术路线图 三、指标打分原则与模型原理 本文参考远东资信2019年IAMAC年度课题“非金融周期性行业债券违约预警系统在保险资产管理机构的应用”的研究成果,采用了该课题中的定性指标和定量指标打分原则,并通过编程实现了定量指标打分模块。课题的打分结果作为本文建模的数据集。筛选出的可能影响债券违约指标共有28个,其中定性指标为8个;定量指标为20个,指标相关信息见表1。 表1信用违约影响因素筛选指标一览表 编号 指标名称 指标类型 编号 指标名称 指标类型 X1 市场地位 定性 X15 总资产周转率 定量 X2 多元化 定性 X16 应收账款周转率 定量 X3 产业链控制力 定性 X17 存货周转率 定量 X4 融资渠道 定性 X18 净资产收益率 定量 X5 公司治理 定性 X19 总资产收益率 定量 X6 会计信息质量 定性 X20 EBITDA利润率 定量 X7 股东背景 定性 X21 毛利率 定量 X8 或有负债 定性 X22 EBITDA利息保障倍数 定量 X9 总资产 定量 X23 EBITDA/短期债务 定量 X10 营业总收入 定量 X24 流动比率 定量 X11 资产负债率 定量 X25 现金收入比 定量 X12 总债务资本化比率 定量 X26 自由现金流动负债比 定量 X13 总债务/EBITDA 定量 X27 经营性现金流动负债比 定量 X14 短期债务/总债务 定量 X28 经营性现金流净额/短期债务 定量 (一)定性指标打分原则 8个定性指标包括:市场地位、多元化、产业链控制力、融资渠道、公司治理与法律、监管风险、会计信息质量、股东背景和外部支持、或有负债。这些定性指标的档位划分和描述主要参考了国内外信用评级行业的评级技术逻辑。表2展示了部分定性指标的打分原则。 表2定性指标评分表(部分) 指标名称 1(风险极低) 2(风险很低) 3(风险较低) 4(风险一般) 5(风险较高) 6(风险很高) 7(风险极高) 产业链控制力 产业链控制力极强,产品标准化程度极高 产业链控制力很强,产品标准化程度很高 产业链控制力较强,产品标准化程度较高 产业链控制力一般,产品标准化程度一般 产业链控制力较弱,产品标准化程度较低 产业链控制力很弱,产品标准化程度很低 产业链控制力极弱,产品标准化程度极低 融资渠道 融资渠道多元化,融资畅通,融资成本低,多家银行给予的授信总额度极高 融资渠道较多元化,融资成本较低,多家银行给予的授信总额度很高 融资渠道以银行借款和股东资金支持为主,融资成本适中,多家银行机构给予的授信额度较高 融资渠道集中于银行借款,银行机构给予的授信额度一般 融资渠道单一,仅有少数银行机构给予授信支持,融资成本较高 融资渠道单一,银行机构不给予授信支持,融资成本很高 融资较为困难,基本无融资渠道 公司治理与法律、监管风险 公司内部治理结构完善程度较高,内控制度很健全,法律、监管风险极低 内部治理结构完善,内控制度健全,法律、监管风险很低 治理结构较为完善,内控制度较为健全,法律、监管风险较低 公司治理结构及内控制度有待进一步健全,法律、监管风险一般 公司治理结构及内控制度设置不够健全,法律、监管风险较高 公司治理结构及内控制度设置存在一定缺陷,法律、监管风险很高 公司治理结构存在显著缺陷,内控制度缺失,法律、监管风险极高 会计信息质量 年报审计意见为标准的无保留意见,最近5年未更换事务所,信息披露极规范 年报审计意见为标准的无保留意见,最近3年未更换事务所,信息披露很规范 年报审计意见为带强调事项段的无保留意见,最近3年未更换事务所,信息披露较规范 年报审计意见为带强调事项段的无保留意见,最近3年内更换1次事务所,信息披露规范程度一般 年报审计意见为保留意见,最近3年内更换2次事务所,信息披露规范程度较低 年报审计意见为否定意见,最近1年更换事务所,信息披露规范程度很低 年报审计意见为无法表示意见,最近3年更换3次事务所,信息披露规范程度极低 股东背景和外部支持 公司为中央国有企业或大型上市公司,控股股东或实际控制人系大型央企,外部支 公司为地方国有企业或上市公司,实际控制人系省/市(区)级人民政府、大型国 公司为大型上市民营企业,若非上市公司则其实际控制人实力较强,外部支持力度 公司为大中型民营企业且实际控制人实力较强,外部支持力度一般 公司性质为一般民营企业,实际控制人实力一般,外部支持力度较小 公司性质为中小民营企业,实际控制人实力较弱,外部支持力度很小 公司为较小规模的民营企业,实际控制人实力很弱,无外部支持 指标名称 1(风险极低) 2(风险很低) 3(风险较低) 4(风险一般) 5(风险较高) 6(风险很高) 7(风险极高) 持力度极大 有集团型企业、外资或合资企业,外部支持力度很大 较大 (二)定量指标打分原则 考虑到同一指标在不同行业之间是不可比的,我们对每个行业(共19个行业)单独进行定量指标阈值确定与 档位划分,并在此基础上进行赋分以消除行业间差异。首先,我们分别收集每个行业所有发债主体的20个定量指标数据。为了消除异常值影响,对数据进行1%双边缩尾处理。然后,以15%、29%、43%、57%、71%、85%、100%分位数作为临界值,将数据划分为7档来确定阈值,并根据阈值对其进行赋分,与定性指标分数类似,7个档位分别为1到7分。 在编程实现方面,当发债企业数据导入“定性与定量指标打分模块”时,系统会根据企业所属行业为其贴上标签,然后与相应的行业打分项进行匹配,根据定量指标所在的区间映射出具体分数。现以采掘行业的部分定量指标评分表为例。 表3采掘行业定量指标评分表(部分) 指标名称 1(风险极低) 2(风险很低) 3(风险较低) 4(风险一般) 5(风险较高) 6(风险很高) 7(风险极高) 资产负债 率 [0,43%) [43%,52%) [52%,62%) [62%,68%) [68%,73%) [73%,79%) [79%,∞) 总债务资本化比率 [0,30%) [30%,41%) [41%,51%) [51%,58%) [58%,64%) [64%,70%) [70%,∞) 总债务 /EBITDA [0,1.79) [1.79,3.70) [3.70,5.91) [5.91,8.00) [8.00,10.59) [10.59,14.6) [14.6,∞) 短期债务/总债务 [0,34%) [34%,44%) [44%,53%) [53%,62%) [62%,71%) [71%,84%) [84%,1] 总资产周转率 [0.88,∞) [0.61,0.88) [0.47,0.61) [0.36,0.47) [0.29,0.36) [0.21,0.29) [0,0.21) 应收账款 周转率 [32.49,∞) [18.14,32.49) [12.01,18.14) [8.74,12.01) [6.33,8.74) [3.94,6.33) [0,3.94) 存货周转 率 [18.67,∞) [12.21,18.67) [9.20,12.21) [6.78,9.20) [4.86,6.78) [2.77,4.86) [0,2.77) 净资产收益率 (%) [10.84,∞) [5.07,10.84) [2.67,5.07) [0.97,2.67) [-0.77,0.97) [-10,-0.77) (-∞,-10) 总资产收益率 (%) [7.14,∞) [4.59,7.14) [3.34,4.59) [2.39,3.34) [1.57,2.39) [0.10,1.57) (-∞,0.10) 毛利率 (%) [35.96,∞) [27.20,35.96) [21.15,27.20) [15.62,21.15) [11.05,15.62) [6.90,11.05) (-∞,6.90) EBITDA利息保障倍数 [9.92,∞) [5.49,9.92) [3.85,5.49) [2.91,3.85) [2.23,2.91) [1.40,2.23) (-∞,1.40) EBITDA/ 短期债务 [0.87,∞) [0.44,0.87) [0.27,0.44) [0.20,0.27) [0.14,0.20) [0.08,0.14) (-∞,0.08) 流动比率 [1.46,∞) [1.13,1.46) [0.90