热门搜索：

人工智能通用大模型（ChatGPT）的进展、风险与应对

2023-03-10-华东政法大学，

AI智能总结

华东政法大学政治学研究院发布了一份关于通用大模型（ChatGPT）的报告，报告包括了通用大模型的近期进展、各国通用大模型的能力比较、通用大模型的治理风险评估以及通用大模型的风险应对策略。

报告指出，通用大模型是指容量较大，用于深度学习任务的模型，通常具有海量的参数和复杂的架构。大模型具有更好的通用性、精度和效率，可以通过预训练或其他方式在大型数据集上进行学习，再通过微调高效地处理计算机视觉、自然语言处理等复杂任务。大模型的运行机制包括预训练模型的发展历程、通用化与专用化并行、平台化与简易化井进等。

报告还分析了各国通用大模型的能力比较，指出大模型的发展趋势是“大模型”和“小模型”协进、通用化与专用化并行。报告对通用大模型的治理风险进行了评估，包括运行机制的风险、数据隐私的风险、技术滥用的风险等，并提出了相应的风险应对策略。

总的来说，通用大模型的发展趋势是向着更高效、更智能、更安全的方向发展，但也需要我们关注其可能带来的风险，并采取相应的措施进行应对。

華东政法大学人工智能通用大模型(ChatGPT)的进展、」风险与应对悟发布单位：华东政法大学政治学研究院华东政法大学人工智能与大数据指数研究院目录 01通用大模型的近期进展 02各国通用大模型的能力比较 03通用大模型的治理风险评估 04通用大模型的风险应对策略通用大模型 01的近期进展通用大模型的近期进展华东政法大学政治学研究院 PoliticalScienceInstitute,ECUPL 大模型的内涵与特征运行机制大模型的发展历程预训练模型的发展历程大模型的发展趋势 “大模型”和“小模型”协进三大特征多模态预训练模型通用化与专用化并行 1通用大模型的近期进展平台化与简易化井进 4/55 1.1大模型的内涵与特征华东政法大学政治学研究院 PoliticalScienceInstitute,ECUPL 大模型是指容量较大，用于深度学习任务的模型，通常具有海量的参数和复杂的架构大模型具有更好的通用性、精度和效率，可以通过预训练或其他方式在大型数据集上进行学习，再通过微调高效地处理计算机视觉、自然语言处理等复杂任务。 Transformer（主要）、GAN、通过海量数据进微调以应用不同解决各种复杂任务 CNN以及RNN行预训练（通才）场景(专家) 等架构预训练模型的运行机制 1通用大模型的近期进展5/55 1.1大模型的内涵与特征华东政法大学政治学研究院 PoliticalScienceInstitute,ECUPL 涌现性扩展性复合性强化技术的融合解决传统A的问题增强A的能力有效集成自然语言处大模型能够有效支在海量通用数据上预训理等多个人工智能核撑智能终端、平台、练以具备多种基础能力，心研究领域的多项技系统等产品应用落摆脱传统人工智能能力术，实现1+1>2的融地，解决壁垒多、碎片化、作坊式开发的合式涌现。部署难等问题。局限。 1通用大模型的近期进展6/55 1.2大模型的发展历程华东政法大学政治学研究院 PoliticalScienceInstitute,ECUPL 单语言预训练模型多语言预训练模型多模态预训练模型具备多样化的基础语言能够处理自然语言，源能力，开始分别处理多于早期的词嵌入（word种自然语言任务，如机 embedding）的工作。器翻译、问答系统、情感分析等。以多语言训练模型为核心，进行文字、图片、视频的同步转化，实现处理多任务的目标。 1通用大模型的近期进展7/55 1.2大模型的发展历程华东政法大学政治学研究院 PoliticalScienceInstitute,ECUPL 多模态预训练模型：人工智能如何理解世界？ .... 文本语音视觉应用领域进展深度多任务学习能够应用医疗于医学影像分析中理解式任务金融同一海量数据的多任务处理工业Multi-Task经典模型结构多模态预训练模型处理多任务全空间多任务模型ESMM 多模态与多任务生成式任务教育预训练模型的结合应用 1通用大模型的近期进展8/55 1.3发展趋势：“大模型”和“小模型”协进华东政法大学政治学研究院 PoliticalScienceInstitute,ECUPL 模型 1.算力要求过高量化 2.显存占用过大模型增强模型抗攻击性剪枝 1.推理增速有限知识减少信息泄露风险 2.训练时长增加 1.经济成本激增蒸馏参数共享降低运行碳排放量低秩 2.能源消耗剧增分解大模型的限度模型压缩技术小模型的好处 1通用大模型的近期进展9/55 1.3发展趋势：“大模型”和“小模型”协进华东政法大学政治学研究院 PoliticalScienceInstitute,ECUPL 作为样本价值判断模型，小模型可以帮助大模型快速学习利用小模型作为Teacher，可以帮助大模型快速收敛大模型借助知识蒸留等技术，大模型的能力可以传给小模型小模型如何实现大模型和小模型的联动和互助改进知识蒸馏等技术，大模型一次可以产出多个小模型 1通用大模型的近期进展10/55 1.3发展趋势：通用化与专用化并行华东政法大学政治学研究院 PoliticalScienceInstitute,ECUPL 表征学习多任务处理单模态多模态多模态编码迁移统一模型框架四学习 1.从算法只能处理一种模态到可以处理多种模态 2.从算法仅能基手一种模态学习并只能应用于该模态到可以学习并应用于多种模态 1通用大模型的近期进展11/55 1.3发展趋势：通用化与专用化并行华东政法大学政治学研究院 PoliticalScienceInstitute,ECUPL 应用需求反哺技术技术落地专用大模型通用预训练专用领域预训练业务场景应用，统一架构：使用统一的模型架构，并采用相同的学习模式框架基础通用大模型，统一模态：构建可以适用于多种模态的通用词表，统一任务：将所有任务统一成序列到序列任务 1通用大模型的近期进展12/55 1.3发展趋势：平台化与简易化并进华东政法大学政治学研究院 PoliticalScienceInstitute,ECUPL 模型开发场景适配推理部署数据增强和清洗能力并行计算能力存储优化能力大模型和小模型无缝联动能力便捷微调能力自适应分布式推理能力开发工具微调工具部署工具低参数调优能力自动化压缩能力自适应分布式训练能力弹性容错训练能力加密部署能力全能、简易开发服务平台 1通用大模型的近期进展13/55 Z 各国通用大模型的能力比较各国通用大模型的能力比较华东政法大学政治学研究院 PoliticalScienceInstitute,ECUPL 美国目前通用大模型的发展现状为何中美之间会存在如此差距？引言：各国通用大模型的技术进展中国对大模型相关领域的布局情况原创能力其他国家大模型技术技术配套的发展情况发展差距制度环境 2各国通用大模型的能力比较15/55 引言：各国通用大模型的技术进展华东政法大学政治学研究院 PoliticalScienceInstitute,ECUPL .ChatGPT(GPT,GenerativePre-trainedTransformer,ChatGPT:Optimizing 生成预训练转换器）的出现反映出了人工智能发展的新趋势，即AI正在从感知智能向认知智能快速发展。，美国作为人工智能发展领域的前沿国家，其拥有一系列具备充足技术和资金资源的公司和实验室，如谷歌、微 LanguageModels forDialogue We'vetrainedamodelcalledChatGPTwhich 软、OpenAI等。interactsinaconversationalway.Thedialogue 中国作为人工智能领域发展的重要参与者，中国正在加formatmakesitpossibleforChatGPTtoanswer 快其在通用大模型领域的投资与研究。例如，百度、腾followupquestions,admititsmistakes,challenge 讯、阿里、科大讯飞等大型科技公司正在加速开发该领incorrectpremises,andrejectinappropriate reguests.ChatGPTisasiblingmodelto 域的技术。InstructGPT,whichistrainedtofollowan instructioninapromptandprovideadetailed response TRYCHATGPT7 2各国通用大模型的能力比较16/55 2.1 美国自前通用大模型的发展现状华东政法大学政治学研究院 PoliticalScienceInstitute,ECUPL 美国自前的科技巨头公司，如谷歌、微软、亚马逊，Meta等都在通用大模型上进行了进一步的布局与投资 ·StabilityAI等AI初创公司同样表示将积极布局AIGC、ChatGPT等相关技术和产业模型名称开发公司技术支持参数量耗费算力主要特点应用范围局限性 3640 Generative支持连续对话、可质疑文本编辑无法进行网 ChatGPTOpenAl Pre-trained Transformer 3.5 千亿级PetaFLOPs主动承认错误、加入RLHF编程、翻译、页搜索、黑 perday训练范式算术箱问题最大化积极影响、避免提较ChatGPT较ChatGPT Claudeconstitution-al Anthropic520亿供有害建议、自主选择文本编辑更代码推理更 (封测）AI加入RLAIF训练范式长且自然弱将加入 Bard较ChatGPT算可以根据最新事件进行对犯事实性错 (内测）谷歌LaMDA1370亿力需求更低话、更负责任 Chromeos为误搜索引擎 2各国通用大模型的能力比较17/55 2.1 美国自前通用大模型的发展现状华东政法大学政治学研究院 PoliticalScienceInstitute,ECUPL 具备指令微调，可以生成创意文本改善其对未见任务的解决基本数学问全部访问权零样本和少样本泛化题、回答阅读理限受限制能力解问题模型名称开发公司技术支持参数量耗费算力主要特点应用范围局限性 OpenPre- BlenderBot3MetatrainedTransformer 1750亿 Megatron-微软Transformer高质量的自然语言训阅读理解、常识被ChatGPT Turing 英伟达语言模型 5300亿练语料库推理、词义消歧反超，在人工智能大模型领域，美国各巨头科技公司均有相关的技术资源，整体而言，目前ChatGPT的表现最为优异。即便是谷歌的Bard在实际表现上似乎也逊于ChatGPT。 2各国通用大模型的能力比较18/55 2.2中国对大模型相关领域的布局情况华东政法大学政治学研究院 PoliticalScienceInstitute,ECUPL 继OpenAI发布ChatGPT大模型之后，中国的各科技公司纷纷加入了大模型开发和应用的队伍。例如、腾讯阿里、百度、科大讯飞等科技巨头公司均有跟进大模型的研发与应用，对自前国内大模型发展而言，我们与国外的差距重点不在模型，而在算力。模型名称开发公司技术支持参数量耗费算力主要特点应用范围局限性文心一言基于百度知识增强较Chat 生成式搜素、跨模文本生成、将加入百生成文本 (内测）百度大模型ERNIE3.0 2600亿GPT算力需求低态理解与交互度搜索引擎较短 Transformer国内首个AI统一图像描述、视觉定位、用户使用通义M6阿里Encoder-Decoder10万亿能耗低底座、借鉴人脑的文生图、视觉蕴含量较少 ResNetBlocks模块化设计混元腾讯基于MoE模型的万亿能耗较低成本较低、多模态计算机视觉、自然语言处理、多模态内容用户使用 IransformerBlock理解、跨模态理解理解、文案生成量较少 2各国通用大模型的能力比较19/55 2.2中国对大模型相关领域的布局情况华东政法大学政治学研究院 PoliticalScienceInstitute,ECUPL 模型名称开发公司技术支持参数量耗费算力主要特点应用范围局限性中国科学基于异思紫东太初院自动化MindSpore千亿研究所框架全球首个视觉-文本语音跨模态检测三模态预训练模型，同时视觉问答、语项目落具备跨模态理解与跨模态生成能力义描述、视频理解与生成地难盘古Encoder- 模型具备极佳泛化能力跨模态检索、华为千亿跨模态生成、模块化（未上线）Decoder架构效率高内容生成等，在人工智能大模型领域，中国公司的科技实力与国外公司存在一定差距中国企业自前正在努力将之前的发展重点（单一模型对应单一任务的专用大模型）调整为通用大

点击免费查看完整报告

你可能感兴趣

人工智能通用大模型（ChatGPT）的进展、风险与应对

你可能感兴趣

人工智能通用大模型（ChatGPT）的进展、风险与应对

人工智能通用大模型（ChatGPT）的进展、风险与应对

人工智能系列之一：从RNN到ChatGPT：大模型的发展与应用

浙大和微软一起搞的大模型协作系统！拥抱GPT：用ChatGPT和它的朋友们来解决人工智能的任务

2023 中国人工智能系列白皮书——数字社会的风险挑战与治理应对