您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[MIT&度小满]:2023年金融科技趋势展望 - 发现报告
当前位置:首页/行业研究/报告详情/

2023年金融科技趋势展望

金融2023-01-27MIT&度小满无***
2023年金融科技趋势展望

2023年金融科技趋势展望 Jan.2023 大模型是数字经济时代智能信息处理的基础设施,它的基底是语言生成模型和语义理解模型。它的语义生成空间非常大,可驾驭空间也非常大、创作自由度高,但是它的自由度太大了,当试图去完成某种真实任务的时候,会由于可控性不够而导致困扰,它的优点反而变成了它的弱点,所以未来要在“可控生成”上面下功夫。 大模型的最主要特点是以机器易驾驭(machinetractable)的方式,即自监督学习的方式博览一切,因广博而产生能力。如果将它的能力放在金融行业中去处理原有的任务,性能和效果将会有显著的提升。如果把各类金融大数据注进大模型去做经济形势的预测,与现有的主流经典分析方法论将会有质的区别,国际上如果因此出了一个诺贝尔经济学奖(将人工智能用于金融研究或预测),我一点都不感到惊奇,甚至是可期待的。 ——孙茂松清华大学人工智能研究院常务副院长、ACLFellow 近期智能计算和智能网络的重大技术突破,依然是深度学习为我们带来了惊喜。从算法角度来讲,首先最有代表性的是深度神经网络,以及预训练模型方向得到长足的发展。预训练模型有一个巨大的神经网络,最新的版本在千亿级参数量,知识深度和广度都让人叹为观止。不论从研究角度,还是应用角度,预训练模型都产生了重大影响——从图灵测试的角度远超过之前的测试,并且具有行业普适性,它可以适用到各种各样的下游AI的任务中去,这是它最具里程碑意义的地方。其次是生成式模型,它所代表的机器创造性也是智能的重要体现。从网络角度来讲,算力是最大的瓶颈,不论是边缘的算力,还是中心化的算力,从目前统计来看,它们的使用率是比较低的。怎么样能够提升它的使用率,还需要一些新的技术,能够打通中心的算力以及整合边缘的算力,使得这些算力能够满足普适的AI的算力要求。 除了算法和算力外,数据也是支撑智能计算和智能网络发展的重要因素,尤其对于金融行业来说,数据的使用和安全更加重要。「隐私、安全和公平性」是最需要关注的三个话题,隐私保护计算、联邦学习、数据的选择和算法改进,分别能够一定程度上解决上述三个问题。此外,从治理角度来看,区块链作为一种基础设施,也是数据治理的重要技术手段,目的是对数据和其他资源进行分布式的自治化治理。 ——郭嵩香港理工大学计算机系教授、IEEEFellow 3 短期内人工智能总体还是会保持大模型、大数据、多数据源、多任务的发展趋势,通过大规模算力堆砌实现接近甚至超越人类的精度。但我们也注意到,数据驱动的人工智能可能无法突破弱人工智能的极限,我们还是应该积极探索数据之外的内容,比如客观规律等“知识”,将其结合到算法中,实现更好的人工智能。 ——陈红阳之江实验室图计算研究中心副主任/高级研究专家 数据分析或者机器学习,对于理解、发现以及使用因果是不可或缺的。这个时代我们有足够多的数据,而且计算资源非常丰富。显然,机器学习一定可以帮助我们更好地理解、发现和使用因果关系。这也是因果表征学习最近几年才提出来的原因。其次,我们希望用因果的思维方式去看待机器学习,这样可以帮助我们从传统的只是基于预测的机器学习,走到更高维的层面,走到理解、可信任、可干预的人工智能发展层面来。因此,理想状态下,这两者相互促进之后,可以让我们有一个基于数据进行学习、有一个很好的表述机制,同时能让人理解并且信任,可以进行合理干预的系统。 ——张坤卡内基梅隆大学哲学系和机器学习系副教授 当前,金融行业数字化、智能化转型正在加速,数据和人工智能技术是关键驱动要素,人工智能技术在金融行业的应用必将革新金融行业的现有服务模式。基于图计算、多模态等技术对于大数据的深入理解和洞察,降低了金融机构风险管理的成本,扩大了服务人群的边界;因果推断、AutoML(自动化机器学习)等技术让业务决策更智能,RPA、情感计算、数字人等技术让金融服务更有温度,提升了用户的服务体验。人工智能在金融行业的应用潜力目前可能只发挥了不到1%,随着技术商业应用成熟度的不断提升,人工智能技术将改变金融行业价值链的每一环节。 ——许冬亮度小满CTO 创造性任务,别开蹊径:生成式人工智能,新一代生产力工具 《ThéâtreD’opéraSpatial》夺冠;“AIgetscreative”入选《Science》2022年的年度十大突破;DALL-E2、ChatGPT和AlphaCode横空出世,因其具有创建和生成超逼真内容的AI能力而迅速走红…… 2022年,上述事件背后所代表的“生成式人工智能”(GenerativeAI)技术,吸引了大多数人的眼球,以及科技企业和资本的大量资金投入。人工智能此前被更多的用于处理机械的数据任务 (判别任务),而生成式人工智能陆续证明能够输出富有创意性的内容,不仅极大地降低了内容(文字、语音、图片、数据、视频等)产出的边际成本,还提高了创作效率。 2001,自然语言处理 2013,深度学习 2017,强化学习 2018,对抗性神经网络 2021,生成式预训练模型GPT-3 2022,AI数据生成 *上述技术入选《麻省理工科技评论》十大突破性技术,为当前大模型出现和生成式人工智能的发展奠定基础 深度学习作为机器学习的重要分支,通过学习给定数据存在的内部规律,实 现对文字、语音、图像等内容的感知、 识别和控制。近年来,借助深度学习,研究人员在自然语言理解、数据挖掘、个性化推荐等领域取得了显著成果,而基于深度学习的大模型也成为实现高维人工智能的主流选择。但对于诸如GPT-3、BERT这类备受关注的Transformer模型来说,Meta⾸席⼈⼯智能科学家杨⽴昆(YannLeCun)认为:“它们是必要的,但并⾮是充分的,这可能是未来智能系统的⼀个组成部分。” 在金融领域中,通过指令,生成不同风格的文字、语音、视频,以及生成一种类似于金融资产标的内容,是它最基本的应用。生成文字、传播文案、语音、图像、视频等,可以用在智能营销、广告等业务场景中,还能够用在客户服务、用户交互、售后服务中。生成式人工智能在金融业务落地层面有一定的直接价值,从生成过程和结果角度来讲,带有创造性质。 创造性人工智能/生成式人工智能目前依然处于实验阶段,尚未出现商业化雏形。生成式人工智能远没有达到替代人的境界,其所输出的内容,暂时没有形成人的逻辑和情感。此外,此类生成式工具背后所依托的大模型的计算成本非常高,以及关于版权、信任、法律规 范等也存在很多问题需要解决。 因果推断:人工智能和机器学习的下一个前沿领域,更高维、值得信任的、有自主性能的人工智能的基础 目前,机器学习算法和模型很擅长于寻找模式、相关性和关联。但它们不能告诉我们:是这个因素导致了那个结果吗?或者如果我做这些事,那么将会发生什么?所以在计算机科学中还有一整个关于因果推理和推断的领域。几十年来,统计学界一直在研究因果关系。因果关系是人工智能和机器学习的下一个前沿领域。 ——周以真(JeannetteM.Wing) 角度去看因果推断。统计学对因果关系的研究,分为两类:一类为因果推断,另一类为概率因果论。人们对因果关系的理解普遍建立在概率因果论之上,所以会容易把相关性当作因果性,因为机器不能很好地分辨内生性问题。随着深度学习和大数据的发展,人们对于事物背后的关系探讨也早不止步于相关关系。 近两年,关于因果发现,或称作因果表征学习(CausalRepresentationLearning)的研究和应用逐渐变得更加活跃,它们与机器学习的关系更为密切, 因为传统的因果推断是只知道了因果图、 因果关系一般指的是两个事件之间 的一种作用关系,其中一个事件会导致另一个事件的发生,前一个称为原因,后一个称为结果。统计学、经济学、社会学、教育学、流行病学等领域均对因果关系做出了研究。在医学中,通过操控实验寻找病因是医学界最常用的因果检测方法。因果推断则是一个更为广泛的定义,指跟因果关系有联系的、跟数据有关的、基于技术的因果研究。 传统的因果研究主要做因果推断,指从一个因果图和数据里面找出一个变量怎么影响另外一个变量(Identificationofcasualeffects),关注这个问题的研究学者聚焦用因果图以及结构方程这个 看到数据之后去分析一个事物怎么影响 另一个事物。 但是一个很重要的问题是,如何从数据中找出因果图以及隐变量,这也是因果发现和因果表征学习的主要目的。我们目前用在机器学习、人工智能、机器视觉里面的数据,很多时候不是结构性数据,更多可能是视频数据或者图像数据。这种情况下,我们看到的变量本身之间未必有直接的因果关系,但是它们背后是由一些因果的因素产生出来的。那么,如何从这种非结构化的数据里面把背后真正存在的因果隐变量,以及它们的关系找出来,是因果推断领域亟待 解决的问题。 长期以来,JudeaPearl是因果论、因果推断的推崇者。当前开展因果推断的两种代表性方法是以DonaldB.Rubin为代表的结构因果模型和以JudeaPearl为代表的因果图方法。而现实应用中,如何去把数据背后的过程信息恢复出来,是让机器和人进行高维智能互动的重要技术支持。在解决实际问题、将因果推断应用到行业中去时,理解实际问题的基本性质是研究因果学习的第一步。 因果研究跟传统的机器学习有很大的区别。传统的机器学习,例如预测,在意的是最优性,不管数据之间噪声有多大,只在意预测的结果是不是最好的。但是因果研究有另外一个性质很重要——要保证得出来的结果跟背后的真相是吻合的。因此需要在不同的领域、针对不同的问题,将因果过程或因果的约束条件变成技术上可用,同时去证明表达出来的事件和事实是吻合的,这就需要因果推断比机器学习付出更多的理论研究和技术上的努力。 具体的场景应用中,因果研究需要关注具体问题的一些性质。要想恢复出来因果性,需要知道有哪些数据、里面哪些性质是可以用来恢复因果性的。不同情况下的数据需能够恢复什么样的因果性,是完全不一样的。所以我们就需要从实际问题出发,去理解这个问题里面的性质之后,再针对这类问题思考如何 能找出背后的事实真相。 因果推断的本质就是从产生的数据里面回推背后的真相,既然它的在不同数据里面表现出来的性质不同,显然,我们就需要针对这种性质,寻找如何有一种方法很适合的方法,去回推背后的因果过程。 在金融行业中,因果模型是智能营销的关键手段,能促成最大化全局营销效率。但金融数据是非常复杂的,如果想要因果的研究方式能真正发现很多我们不知道的可靠信息,一定需要对金融数据的性质有一个很深入的认识。再将目前的分析方法做一定的调试修改,才可以把系统背后的因果性找出来。 因果推断领域当前最需要进行深入研究和拓展的两个方向,一个是因果表征学习,需要让机器能从各种数据里面找出背后有意义的表征。机器必须走到这一步,人类才能信任他,才能做到所谓的可解释AI。这是从人工智能的角度来思考,如何能得出一个特征提取的方法,或者是如何表述数据的方法,使得人可以信任机器的处理方式。 第二个则是针对一个具体的实际重要问题,如何能把这个问题解得更好,需要开发专门的因果表征学习或者因果发现的方法,能把这个问题真正地解决好,这将对科学和人类社会进步有帮助。 多模态情感计算:为人工智能决策提供了优化路径 情感计算(AffectiveComputing)是一个快速兴起的交叉前沿学科,涉及计算机科学、脑与心理科学、社会科学等学科。由于深度学习等人工智能领域的技术突破,作为人工智能和认知科学的结合,情感计算在商业、管理等领域有许多前景广阔的运用,近年来更是成为理论研究的一个热点。在情感计算领域,运用最多的理论模型是情感分类理论模型,主要包括离散情感模型和维度情感模型。在理解式和生成式大模型的支撑下,情感计算的准确度上有望提升,这对金融领域的应用无疑是有益的。 计算机科学 提供各类信息技术手段和工程化能力,对情感的感知、识别、理解、反馈 心理及意识领域 等实施数字化重构和计算实现,从而使机器能够拥有类人情感心智功能 提