您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[阿里巴巴]:2024大模型技术发展及治理实践报告 - 发现报告

2024大模型技术发展及治理实践报告

信息技术2024-01-12-阿里巴巴棋***
AI智能总结
查看更多
2024大模型技术发展及治理实践报告

三大发展引擎(公共云、开源生态、高质量数据)+一套安全架构 大模型已成为新质生产力的重要组成部分,促进着科技融合创新、产业结构升级。同时,也面临着来自算力、算法、数据以及安全等方面的新挑战。现如今,兼顾发展与安全的治理模式逐渐成为共识,本书基于大模型技术及其应用的风险现状与产业实践,形成了以公共云基础设施、开源生态、数据供给为发展引擎,以安全可信架构为保障的治理蓝图,为落地实现发展与安全兼顾的目标提供参考。 多角色全生命周期治理实践 大模型产业应用日益广泛,生态愈发成熟,其背后是逐渐清晰的角色划分和更加复杂的应用模式。在大模型研发应用的全生命周期中,基础供应者、技术支持者、服务提供者、服务使用者、内容传播者等相关角色在产业发展和安全保障方面承担着不同的使命和责任。在大模型落地应用时,还有更多的工具/插件、文档及环境信息、知识库等被开发和利用,帮助提升大模型的能力。 在这种复杂多元的产业现状下,新风险和新挑战与日俱增。如何沉淀多方安全实践,明确全链路、多角色的技术与应用控制措施,促进协同治理,有效防范化解人工智能的风险,保障大模型技术及应用的持续稳定发展,是本书阐述的重点。 大模型技术发展及治理实践报告 大模型技术发展及治理实践报告 编写单位 指导委员会 专家委员会 编写组组长 邵晓锋闻佳俞思瑛范科峰钱磊 阿里巴巴集团风险委员会主席阿里巴巴集团公共事务总裁阿里巴巴集团首席法务官 中国电子技术标准化研究院副院长阿里巴巴集团安全部总裁 薛晖朱红儒袁媛姚相振胡影 阿里巴巴科技伦理委员会委员&AAIG主任阿里云智能集团标准化业务副总裁 阿里研究院院长 中国电子技术标准化研究院网安中心主任中国电子技术标准化研究院网安中心副主任 张荣郝春亮 阿里云智能集团通义安全负责人 中国电子技术标准化研究院网安中心数据部主任 编写组主要成员关于我们 傅宏宇李娅莉彭骏涛黄龙涛陈岳峰沈晖杨易侗马宇诗 鸣谢 阿里研究院人工智能治理中心主任阿里巴巴达摩院法务安全负责人阿里云智能集团AI标准负责人阿里安全资深算法专家 阿里安全AIGC安全算法负责人阿里巴巴达摩院安全总监 阿里安全生态合作负责人阿里安全高级体验设计专家 张妍婷黄晴 中国电子技术标准化研究院大模型安全标准负责人中国电子技术标准化研究院工程师 阿里巴巴人工智能治理与可持续发展研究中心(AAIG)是阿里巴巴集团旗下的人工智能顶级研发团队,致力于利用AI技术解决安全风险问题,并推动AI技术更加安全、可靠、可信赖和可用。团队成员在计算机视觉、自然语言理解、数据挖掘与网络安全等领域的国际顶级会议和期刊上发表论文100多篇,获得国际国内专利授权60余项,申请中专利200多项。 AAIG贯彻“科技创新是最好的网络安全”的理念,所研发的人工智能产品涵盖内容安全、业务风控、网络安全、数据安全与算法安全等多个领域,为集团在全球的千万商家和十亿消费者提供更好的安全和体验。 联系我们 朱琳洁王峥陶嘉羚许晓东聂云奕李进锋李金纯杜东为王莹徐璐妮牟立�石洪竺张强 aaig@list.alibaba-inc.com 扫码关注微信公众号 89 大模型技术发展及治理实践报告 目录 一 引言 1.大模型成为新质生产力的重要组成18部分 2.安全可信是大模型持续发展的基本20要求 二 大模型发展与挑战 1.大模型技术与应用的发展现状24 1.1原生多模态成为发展主流24 1.2超长上下文理解能力不断突破24 1.3传统人机交互方式被颠覆重塑25 1.4大模型的应用模式日益丰富、产业生态愈发26 成熟 2.算力、算法、数据与安全挑战27 2.1算力短缺问题突出,制约大模型持续发展27 2.2模型结构创新难度大,可解释性问题加剧28 2.3高质量数据供给不足,成为模型训练新瓶颈28 2.4大模型的技术特性带来了新的安全风险29 三 公有云是大模型技术发展和应用落地的优选路径 1.大模型的训练强依赖大规模的基础设34施 1.1资源挑战34 1.2技术挑战34 2.公共云是大模型发展与应用的优选解36 决方案 2.1公共云为训练全球领先的大模型提供必要条件36 2.2公共云提供高效率和低成本37 2.3公共云为大模型提供全面安全保障39 3.公共云可有效应对算力短缺困境41 3.1算力短缺的根本原因是供应无法满足需求41 3.2公共云最大化发挥稀缺计算资源的价值,推动42 规模化应用 3.3公共云可协同利用多来源算力,丰富算力生态42 四 开源生态促进大模型算法发展与安全 1.开源生态对于大模型的诞生具有基础46性作用 2.开源生态是大模型技术发展和应用推48广的加速器 2.1大模型开源的核心意义是普惠48 2.2开源生态助力提升大模型透明度与安全性49 2.3开源生态加速大模型发展和应用50 2.4开源生态助力我国抢占产业生态制高点51 3.开源生态提升大模型安全性、强化业53 界信任度 3.1开源生态促进多方协同安全治理53 3.2开源生态确保模型安全评估客观公正54 3.3开源生态帮助建立业界对大模型技术的信任55 大模型技术发展及治理实践报告 五 高质量数据供给生态是具备持续竞争力的基础 1.合成数据是解决高质量训练数据供给58不足的突破口 2.构建更匹配模型部署要求的高质量应61用数据生态 2.1数据上云推动模型应用数据生态建设,提供保61障数据安全的能力基础 2.2检索增强是模型高质量用数的可行方案62 2.3以更开放、务实、多元的方式促进高质量数据64 供给 六 体系化的安全治理能力是稳定发展的保障 1.多角色视角安全治理架构68 2.大模型安全治理规范:全面多元融合71 的规范框架 2.1法律法规、标准规范、伦理道德原则的性质、71 作用、执行路径有明显的差异 2.2组织保障是一切体系化治理能力的基础72 3.大模型安全治理措施:技术与应用风73 险治理构成的立体防护网 3.1围绕全生命周期的技术治理措施73 3.2针对用途和场景的应用风险治理91 3.3以安全使用管理防范滥用误用行为93 4.模型产业链逐步成熟,多方协同治理95 价值日益凸显 4.1多方协同治理的价值95 4.2多方协同治理的特点96 4.3多方协同治理中的产业贡献96 七 结语附录A:大模型各领域应用场景及实践案例 1.1个人生活新助理106 1.2产业智能新模式106 1.3公共服务新体验108 大模型技术发展及治理实践报告 附录B:云上开放的大模型平台:百炼 1.大模型时代的需求分析110 附录C:人工智能开源社区:魔搭 1.人工智能发展与应用须跨过四道门槛121 1.1灵活性和弹性兼备的计算能力 110 1.2丰富的模型供给 111 3.魔搭社区的四大核心优势 123 1.3模型全生命周期的服务1.4构建应用的工具链 111112 4.魔搭社区正成为模型应用的“加速器” 124 2.MaaS实现人工智能模型“开箱即用”122 1.5合规与安全是基础112 2.百炼作为大模型服务平台的突出优势113 2.1百炼提供强大而实惠的计算资源113 2.2百炼提供丰富的模型供给114 2.3百炼提供模型全生命周期的服务115 2.4百炼提供构建应用的完整工具链116 2.5合规性与安全性118 3.百炼助推我国人工智能行业发展120 5.魔搭社区助力大模型安全125 大模型技术发展及治理实践报告 1..大模型成为新质生产力的重要组成部分 大模型已成为信息技术的新里程碑。纵观历史,信息技术的发展往往由计算机技术、数据技术、算法技术的独立发展而推动,传统人工智能局限于执行特定目的功能、应用于特定场景之中。大模型整合利用了各类信息技术资源,不仅代表着算法的飞跃,也是算力、数据、工程等协同发展的结果,推动信息技术新拐点的到来。随着大模型的不断发展,人工智能的能力边界不断拓展,正逐步从目的单一、场景限定的专用型人工智能向具有认知和推理能力、胜任多种用途的通用型人工智能转变。 大模型促进科技进一步融合创新。自2023年以来,大模型步入了高速发展阶段,技术先进性和能力通用性兼备成为其核心优势,通过大模型赋能千行百业,利用人工智能提高传统要素的边际生产率已经逐步成为现实。在国家大力推动“人工智能+”行业应用融合创新的背景下,大模型已经渗透到许多行业并得到深度应用,例如,在在线购物中降低商品展示成本、提高用户购物体验;在工业机器人和无人驾驶中,环境感知和判断提高了其自动化能力;人工智能驱动的科研推动解决蛋白质组成结构等科学难题。从服务用户到助力生产,从基础研发到应用开发,大模型大幅提升了生产效率和创新能力。 大模型创新推动产业结构全面升级。大模型所带来的技术革新降低了知识门槛、节约了创新成本、提高了市场活力,让更多人能够参与到创造性活动中,催生全新的商业模式和服务形态,引领新一轮的产业转型升级。大模型有望在未来重塑产业链条,推动形成以数据驱动、智能主导的新型生产方式和经济增长点,让经济发展始终保持活力,通过持续创新推动高质量发展,用科技进步解决发展带来的不平衡难题。 大模型发展与治理同步推进成为新共识。大模型技术的出现和发展标志着人工智能从专用化走向通用化,人工智能超越人类智能、人类和机器共生共栖的社会场景从幻想走向现实。人工智能从多元发展转向聚焦于大模型的通用能力,通用人工智能成为国家科技能力现代化的重要标志,大模型的泛化、推理等特有能力为大模型更为广泛的应用提供了新的机遇,大模型研发所需的模型、算力和数据等科技要素成为关注焦点,对人才、投入和制度进行有效利用和合理配置的政策试点也迅速铺开。与此同时,大模型超出预期的表现也不断刷新人类对机器智能的认知。人工智能的突破性创新对人类文化价值、社会经济形态、个人基本权益带来诸多影响,重构人类对机器的主导性和权威性,让人工智能回归以人类为中心的发展路径,有效管控大模型带来的核心风险等目标成为各国政府以及人工智能产业界的共识。 大模型技术发展及治理实践报告 2..安全可信是大模型持续发展的基本要求 人工智能安全理念从AISecurity向AISafety发展。随着互联网步入智能化时代,网络空间安全的关注重心从系统安全、数据安全转向人工智能安全。大模型技术的快速发展和通用化应用潜力对人类社会和网络文明带来了新的挑战,相较于关注系统完整性、防止数据泄露和未授权访问的AIsecurity理念,AIsafety理念更多聚焦于前沿人工智能技术对人类核心权益和中长期发展的影响,通过寻求共识、构建规则、评估影响、防控风险、完善技术、落实责任、推动协作的系统化机制,将国家安全、个体权利、群体利益、国际合作等纳入人工智能安全的标准和要求之中,呼吁各方共同面对人工智能带来的不确定性挑战,更负责任地开发、部署和使用人工智能,防止滥用误用,通过人工智能安全治理构建信任,让可靠的人工智能推动网络技术应用发展。 追求大模型安全可信是全球共识。自大模型问世之时起,其潜在的安全风险和安全技术能力就备受全球关注,在大模型技术能力不断突破、模型性能不断提升的同时,人们对大模型安全风险以及安全治理的研究也在持续推进。根据大模型的技术特征和应用特点,对大模型进行有效治理,让大模型始终处在人类控制之下,不断降低大模型的安全风险,让大模型更好地服务人类发展,已成为全球共识。欧盟针对通用人工智能进行立法,保障人类权利免受大模型侵害,美国、英国则针对基础模型或前沿模型提出安全倡议,并发展风险评测等安全技术。我国《全球人工智能治理倡议》强调以人为本、智能向善,坚持发展与安全并重,提出打造可审核、可监督、可追溯、可信赖的人工智能技术,以务实、包容的态度动态管控大模型风险,综合采取政策、标准、技术等手段,让大模型成为安全可信的生产力工具。人工智能科技企业主动尽责,响应政府倡议、落实安全要求,在大模型安全方面加大投入、加强研究,不断提高大模型安全水平,更好地在人工智能技术扩散期建立信任。 安全是大模型发展的必然要求,是大模型广泛应用的前提条件。一是人工智能技术的发展离不开安全。人工智能安全技术能够控制人工