您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[新世纪评级]:理性认识AI技术在信用评级业的应用 - 发现报告
当前位置:首页/行业研究/报告详情/

理性认识AI技术在信用评级业的应用

信息技术2024-09-23朱荣恩、胡小波、戴晓枫新世纪评级米***
AI智能总结
查看更多
理性认识AI技术在信用评级业的应用

理性认识AI技术在信用评级业的应用 新世纪评级朱荣恩胡小波戴晓枫 近年来,人工智能(ArtificialIntelligence,AI)、区块链、云计算、大数据等金融科技中的关键技术已广泛应用于金融行业各个领域,并为金融服务带来切实可见的技术创新和便利。其中,AI技术能够替代人工重复性工作,提升效率和用户体验,一直是当前科技界和资本市场的热门话题。对信用评级行业来说,引入AI技术既有利于优化业务结构、提高评级效率,也可通过该技术的持续发展一定程度上解决行业痛点。但现阶段AI技术仍然有诸多的局限性,信用评级行业引入相关金融科技应用存在一定风险,应理性看待。 一、AI技术在金融业和信用评级行业的主要应用和风险 (一)AI技术在金融业和信用评级行业的主要应用 AI技术具有自动化、大数据处理能力、快速学习和适应能力、实时决策能力等方面的优势,为各行业带来了创新机遇和改进空间。目前,AI技术在金融行业的应用已涵盖多个领域,如智能客服、智能投顾、智能风险管理、信用风险评估、欺诈检测、合规监管等(肖欣荣和李怡雯,2023;何涛,2024),为提高金融服务效率、降低业务成本、促进业务创新提供了卓有成效的技术支持,有效改善了金融行业的客户体验(曾雄,2023)。 例如,智能客服主要是利用ChatGPT能够结合上下文语境智能生成可用于营销、解答问题等交互能力强的对话,与现有的金融机构客户服务中心的自动客服相比更具智能性和灵活性、准确程度更高,可与人工客服相媲美,实现对现有自动客服的全面替代。又如,由于AI技术在分析海量结构化和非结构化数据方面具有优势,金融机构可以利用机器学习算法对历史数据进行分析,建立风险预测模型,以达到快速识别异常模式和趋势、提前预警风险的目的。另外,AI技术可通过模拟和分析不同的市场情景和压力测试,评估金融机构在不同条件下的抗风险能力,并结合金融机构设置的交易规则和限制,自动识别和拦截风险交易,降低操作风险和人为错误。AI技术为金融机构的风险管理提供服务已成为人工智能在金融科技创新中的重要应用之一。 具体到信用评级行业,一些评级机构已在实践中引入AI技术,主要使用在大数据分析、机器学习、智能挖掘、智能打分、实时监测等方面,为信用评级业务的创新升级提供助力,有利于这些机构提高评级的准确性和实时性,帮助机构为投资者及市场提供更精准的信用服务。 (二)AI技术在金融业和信用评级行业应用中存在的风险 AI作为计算机科学的一个重要分支,以其显著优势在近三十年来获得了快速发展。然而,AI技术本身自带局限性,如对大量高质量的数据依赖度高,黑盒模型缺乏透明度和解释性,训练数据和算法可能存在偏见导致的结果不公平,缺乏人类真正的智慧、创造性和理解能力,缺乏道德判断能力,等等。这些使得AI技术在金融业和信用评级行业的应用过程中存在着数据质量问题、透明度和可解释性问题、隐私和安全问题、监管和法律问题等方面的风险和挑战(张钰宁等,2024),较大程度上限制了AI技术在金融业和信用评级行业内的深度应用。 AI技术的应用效果通常依赖于数据长度和数据质量,开发AI模型需要海量的高质量数据进行训练,否则将严重影响模型的准确性和可靠性,甚至引发模型错误。对国内金融行业而言,金融业子行业众多、监管要求高,行业数据和场景具有敏感性,要收集到适合AI模型开发所需要的大量高质量数据难度较大(孔文佳,2022)。特别是汉语与英语在语言属性上的本质不同,数据收集、清洗、标注等处理工作难度更大,成为AI技术在国内金融业深度应用的主要挑战。 二、信用评级的客观属性对AI技术应用的限制 (一)信用评级的预期性和艺术性双重属性决定了评级方法和模型复杂性, AI技术较难进行综合性全面考量 信用评级具有预期性和艺术性双重属性(朱荣恩,2013;中国银行间市场交易商协会教材编写组,2020),是信用评级区别其他行业、特别是鉴证类行业的重要特征。信用评级的预期性是基于历史数据和信息以及社会和经济的运行逻辑,在合理假设条件下对未来的预期,而不是对历史数据和信息的真实、准确、完整的鉴证;信用评级的艺术性表现为信用评级是在多因素或指标分析的基础上,采用定量和定性相结合的分析方法对受评对象的信用质量进行综合性判定。信用评级的预期性和艺术性决定了信用评级的跨学科、多理论基础的特征,也决定了评级方法和模型较为复杂,这在较大程度上限制了AI技术在信用评级行业内的深度应用。 信用评级方法和模型的复杂性一般表现为评级方法体系的系统性、评级架构的层次性以及评级要素和指标的多样性。具体来看,信用评级方法体系是指在不同行业分类的基础上形成的具有大类行业特征的评级方法的结构性图谱,一般分为三个层次:信用评级总论、大类行业的综合性评级思路以及具体行业的信用评级方法,系统性特征非常显著;一般性的信用评级架构(针对一般主体的信用评级架构)具有明显的层次性,即应符合从国家/地区风险分析到行业信用风险分析、主体信用风险分析,再到评级调整和外部支持分析的逻辑演进路径,最终得 到主体的信用等级;而分析国家/地区风险、行业信用风险以及主体信用风险的过程中,均会涉及两级甚至更多的要素和指标,评级要素和指标具有多样性特征。 信用评级架构的宏观、中观、微观的层次性和评级要素和指标的多样性,对AI技术的深度应用提出了挑战。现行AI技术在数据搜集、数据质量等方面存在不足,特别是评级过程中所涉及的要素多、指标复杂,AI数据搜集生成内容的准确性相对偏弱,数据质量无法保证,从而影响后续的深度学习,导致模型性能下降或产生错误的结果。另外,不同行业的评级模型在评价维度、要素设置、指标选择、权重设置等均有不同,这就进一步提升了AI技术的应用难度,导致应用AI技术无法进行综合性全面考量。 (二)AI技术无法完全替代经验丰富的分析师在信用评级中的主导地位 信用评级的分析师主导模式一般指的是信用评级过程中由分析师主导对受评对象进行信息收集、加工、处理、分析并得出初步风险判定。评级过程遵循的定量和定性分析相结合的业务原则中,定性分析,特别是评级调整项的判定和外部支持的判定,对分析师具备的知识体系、执业能力和评级经验的依赖度非常高。而在评级结果的最终确定环节,也是由评审委员会通过专家意见法对最终评级结果进行认定。若考虑评级方法和模型体系的构建和完善过程,分析师将自身评级经验及其他分析师对同类行业的评级经验进行总结和升华,选择关键要素和指标、确定评级逻辑和权重,形成或修订评级方法和模型,这一过程是分析师将其知识储备、评级经验、创新能力和智慧运用集中并输出的体现。 上述环节均表明信用评级的业务开展离不开分析师、评审专家的经验积累和思维创新,即信用评级的基本流程及其须遵循的业务原则决定了分析师在信用评级中的主导地位。亦即,信用评级过程是分析师积累经验的过程,是分析师将评级经验应用到实践、再从实践升华为理论(评级方法)的过程。这些过程是目前主要基于机器学习和模式识别的AI技术无法实现的,AI系统无法像人类一样进行抽象思维、推理和创新。 鉴于评级方法体系的复杂性,部分要素模块设置、权重参数调整呈现动态化特征,不少指标存在非线性特征、不确定性较高,未来发生的变化可能会超出现有数据库的记录范围。受限于AI系统泛化能力,AI技术预测和判断有可能出现关键动态即时指标缺失或偏差,从而导致模型准确性下降。另外,一些突发性信息的出现,特别是定性信息,AI技术通常无法应对而出现系统失灵。因此,定性或即时信息的准确判断目前仍有赖于评级专业人员,也就是说,AI技术无法完全替代经验丰富的分析师。 (三)AI系统难以全面实现信用评级的独立性、客观性、公正性 信用评级天然具备的“缓解信息不对称、服务投资者,揭示信用风险、提供定价参考,提升市场交易效率、促进公平交易和监管”的内在基本功能和作用,决定了信用评级行业在金融市场中的重要地位,也成为信用评级公信力的基础。 为做好利益冲突防范、保证评级质量、提升评级公信力,信用评级机构开展评级业务时应符合国际、国内评级监管的制度要求,遵循独立性、客观性和公正性原则。信用评级这三大一般性原则的落实主要通过信用评级机构的内部制度得以保障。而AI系统一般是通过对大量数据进行深度学习和训练后而生成的,其内核往往是黑箱模型,决策和推理过程均难以解释和验证。若训练数据存在偏见或算法存在歧视,都将导致不公平的结果。 就信用评级质量控制与合规管理而言,如果由AI系统完全主导控制评级工作全流程,将出现难以追溯问题源头等情况,导致评级机构和分析师无法对各个评级环节进行评级质量的全面控制,不利于行业监管和自律管理。 三、应用AI技术需充分结合中国信用评级行业的实践 (一)中国信用评级行业的发展具有中国特色 信用评级在某种程度上是反映经济领域意识形态的金融工具,最初的信用评级起源于19世纪初的美国。我国信用评级行业发展至今仅三十余年,行业内各机构的评级技术均是在学习国际评级技术的基础上进行吸收、转化,形成了目前的具有中国特色的信用评级方法,服务于中国债券市场,这是一个中国化的改造过程。 现阶段,国内评级行业的评级技术已与国际评级机构存在较多差异,且国内评级机构之间的评级技术也有较大不同。若使用AI技术对全球信用评级相关的知识体系进行广泛学习和训练,这就导致AI所生成的体系可能是模糊混沌的,可能是认知混乱的,甚至也可能形成技术和权威霸凌,将限制我国信用评级机构在债券市场发挥应有的作用。况且,目前部分AI技术的相关应用也暂未在中国开放,若国内应用时需借助国际AI技术或算力,或将导致评级核心技术的流失。 (二)中国信用评级行业肩负金融系统稳定性和安全性重任 信用评级具备对资产进行风险定价参考、为投资者提供投资组合决策依据、促进市场公平交易和监管的作用,在金融系统的稳定性和安全性方面扮演着重要角色。特别是在中国债券市场中,信用评级对于投资者、发行方和监管机构等市场各方均具有重要意义。中国债券市场自发展以来始终重视信用评级的作用,将信用评级作为债券发行中的一种制度安排。尽管现阶段降低评级依赖、取消强制评级、取消债项强制评级等政策已经实施,但市场各方仍密切关注发债主体的信 用质量。 信用等级的稳定性关乎发行人的融资成本和融资渠道。若应用AI技术后,出现了与原评级结果差异较大且无法解释的结果,小则造成发行人融资渠道受阻、资金链断裂、出现经营困境,大则可能造成整个金融体系出现系统性风险,严重影响金融系统的稳定性和安全性。同时,中国债券市场中的债券发行人大多经过国内评级机构的评级,评级相关数据资料都在受托评级机构内存档。AI技术需要大量的数据进行训练和应用,考虑到西方部分AI技术对中国的限制,若在使用AI时将国内债券发行人的资料泄露,特别是涉密资料的泄露,将对发行人的安全和国内金融体系的安全带来隐患。 (三)评级监管趋严环境下,信用评级深度应用AI技术将对监管提出挑战 “加快建设金融强国”战略目标的提出,为信用评级行业高质量发展指明了方向。为提升国内评级机构服务质量和公信力,国内各评级监管部门均颁布了多项自律管理新规,评级监管进一步严格。就评级机构自身而言,根据监管部门政策修订内部管理制度、做好合规展业是第一要务。而AI技术的黑箱模型缺乏透明度和可解释性,不利于评级合规管理和监管的开展。 另外,从国外近年来AI技术发展来看,AI技术高速发展和应用所可能带来的失序和失控的风险已经引起多方的忧虑。2023年3月,美国技术伦理组织要求美国联邦贸易委员会阻止OpenAI发布新的GPT商用版本,并对OpenAI展开调查。意大利、德国、加拿大、西班牙、法国等多国相关部门宣布对OpenAI展开调查,甚至禁止使用ChatGPT(李紫菡等,2023)。 四、信用评级行业AI技术应用建议及关注点 科技的价值是赋能,没有一个行业和产业可以无视科技的力量,但在兼收并蓄的同时,也应该认清边界、有所为有所不为。信用评级的预期性和艺术性双重属性决定了AI技术在评级行业的应用主要集中于“术”的层面,深度、全面地综合性运用则面临