热门搜索：

张世磊：体系化人工智能技术（Holistic AI）技术探索

信息技术2023-11-27中国移动研究院路***

AI智能总结

中国移动研究院的九天团队正在探索体系化人工智能（Holistic AI，HAI）技术。HAI的目标是满足日益丰富的数智化业务需求，同时确保AI业务的可信可控安全。HAI的主要特征包括AI服务大闭环、AI能力原子化重构、网络原生AI及安全可信AI。根据智能化业务需求，HAI可以按需对AI能力进行调度、配置和运行监控，使其能在最合理的算网资源上运行和服务行业及个人客户。

体系化人工智能(HolisticAI)技术探索中国移动研究院张世磊2023.11.24 日趋泛在的智能化需求和智能化技术赋能成本高之间的矛盾企业智能化需求持续增长中国移动商用落地的智能化项目数量三年增长100多倍 1800 900 0 2019 2022 核心技术研发成本高 GPT-3大模型训练成本费用成本 460万美元时间成本 1GPU×355年定制化、商务、运维成本高典型AI商用定制化项目成本构成定制化研发部署交付测试售后运维售前解决方案数据采集合同验收需求沟通日趋泛在的智能化需求智能化技术赋能成本高人工智能的应用需求复杂、迭代优化、运营成本弱人工智能强人工智能（限定领域、人工参与）（通用领域、自动化）数据成本、算法成本算力成本、人才成本提供技术基础性能降成本自动化提高定制化任务性能 LLM 使能的自主智能体 LLM ASurveyonLargeLanguageModelbasedAutonomousAgents 自动机器学习神经网络架构搜索单模型的通用化基于AI任务的自动化支撑环境适宜：选择环境，培育环境共性能力：合理评估AI能力的可达性，构建可达的共性AI能力平台化：实用便捷的工具，运营运维业务本身是规模化的：客户规模，经济规模规模化应用个政企领域（B）甘肃智能客服 -服务2500万甘肃百姓 -6000万关系政务知识图谱 -事项覆盖率100% CHBN赋能价值个人领域（C) 10086智能客服 -服务10+亿客户 -峰值月交互量2.1亿次 -问题一次解决率94.2% 家庭领域（H）大屏数字内容推荐 -服务家庭7600+万户 -观看率提升42% -单省收入赋能7000+万网络领域（N）智能基站节电 -29省全网部署 -单站减排300千克/年 -单站节电量提升8%-10% 管理领域（M）智慧党建 -服务16万党员 -知识检索效率提升90% -构建超5万条知识点数据库通用能力智能语音智能推荐机器视觉智能数据分析自然语言理解个网络智能化能力簇感知智能预测智能诊断智能决策智能控制智能服务内部客户服务外部客户云端能力调用次数边端能力调用次数赋能价值服务客户核心能力平台型产品个 ⑥网络智能化平台 ③智能交互平台 ①九天深度学习平台 ⑦九天·毕昇教育平台 ④可视化建模平台 ⑧城市AI平台（合作） ⑤智能推荐平台 ②九天AI能力平台基础大模型：加快构建适用于泛场景的自主可控通用基础大模型，打造通用智能底座行业大模型：聚焦供给侧，加快构建行业大模型，加速国民经济主体行业的智能化转型升级，促进我国整体生产力跃升语言大模型视觉大模型语音大模型结构化数据大模型多模态大模型支撑政府治理工业生产民生服务通信特色衍生 ... 客服模型网络模型 ... 医疗司法模型模型 ... 物联网模型能源模型 ... 交通模型政务模型行业智能化应用基于体系化人工智能的智力运营性能评测安全评测数据评测大小模型算力基础数据基础网络基础 L1 行业大模型 L0 基础大模型以九天基础模型为基础，联合通信、能源、航空等行业的骨干企业，共建共享九天·众擎基座大模型通信能源航空医疗政务建筑交通运输冶金智算引擎九天基础模型测评系统人工智能训推技术服务平台基础设施算力网络大规模智算中心数据汇聚平台 3700+ 支撑生产 1000+ AI能力 7+万亿累计调用次数网络问题投诉级联优化通常需要在满足计算、传输、安全、可控性等多项约束前提下，组合使用多个模型或能力，包括基础模型、行业模型或面向特定任务的小模型，并能够端到端优化服务于业务目标体系化人工智能（HolisticAI，HAI）是中国移动研究院九天团队原创技术的攻关方向，依托泛在的网络和AI算力，在开放环境中实现对AI能力进行灵活且高效的配置、调度、训练和部署，以满足日益丰富的数智化业务需求，同时确保AI业务可信可控安全，其主要特征为AI服务大闭环、AI能力原子化重构、网络原生AI及安全可信AI。根据智能化业务需求，按需对AI能力进行调度、配置和运行监控，使其能在最合理的算网资源上运行和服务泛AI算力云/网/边/端/…GPU/ASIC/ 可信 NPU/CPU/… 泛AI算力提供方大闭环体系化AIOS 泛在网络资源提供方可信 AI能力大闭环原子化网络原生业务可信行业及个人客户 AI核心能力及模型提供方 1、“大闭环”（BigLoopAI） “大闭环”AI以业务端到端的大闭环优化为目标，重点攻关多能力级联与并联优化、开放动态环境中AI能力优化的基础理论和技术，从而达到AI产业闭环。 2、AI技术原子化重构（AtomizedAI） AI能力依据高复用、易调度、自闭环、易适配等原则进行原子化拆解和重构。一个典型的原子化AI能力包含通用智能层、适配层、接口层，通用智能层可多个能力共享。AI原子化重构是体系化人工智能得以实现的基础。 3、网络原生（NetworkNativeAI）网络原生AI将AI能力与算力通过标准化的方式接入网络、按需调度，重点攻关AI模型自动伸缩的理论和机制，制定AI计算资源、数据、模型、能力、服务的功能、流程、接口和计量的标准，实现AI能力在网云边端弹性部署、计算和迭代。 4、安全可信（TrustedAI） AI数据、模型、能力、业务的安全可信是体系化人工智能服务的重要基础，重点攻关AI服务可追溯、可互信、可审计、抗攻击的基础理论与方法。可追溯、可计量HAIprotocol 能力区案原子解决方行业区原子能力区分层次多粒度的原子能力市场 n AI 模型算法蒸馏定制区模型类1 模型类n模型类N 能力更新 taskinstancespool 开放动态环境优化场景类1 场景类n场景类N VectorDBLong-termmemory 需求1 任务区 n 需求n需求N ........... 服务计量、评估、回收能力空间 Hai大模型需求思维链任务分解适配及优化部署应用动态测量评估注册功能区 n Standardization&TrustedAI assessment 模型服务提供商 max�(�,�,�,�,�,�,�,�,�,�) s.t.�(�,�,�,�,�,�,�,�,�)≤� 其中： �是一个复杂的函数，表示体系化人工智能的内部逻辑和流程。数据集D=[d1,d2,…,��]，每个数据d�都有一个类型��∈[0,1,2,…,�]，表示文本、图像和语音等异构数据类型。模型集M=[�1,�2,…,��]，每个模型��都有一个类型��∈[0,1,2,…,�]，表示分类模型、预测模型和生成模型等不同模型。原子能力集�=[�1,�2,…,��]，��是第�个能力，表示语音识别，语音增强，图像分割，机器翻译等不同的能力。真实环境数据分布集P=[�1,�2,…,��]，每个分布��都有一个类型��∈[0,1,2,…,�]，表示高斯分布、均匀分布和其他复杂分布。原子化评估集E=[�1,�2,…,��]，每个评估��都有一个指标��∈[0,1,2,…,�]，表示不同的评估指标。标准规范入库集S=[s1,�2,…,��]，每个入库��都有一个条件��∈[0,1,2,…,�]，表示入库准则。真实场景数据漂移集F=[�1,�2,…,��]，每个漂移��都有一个类型��∈[0,1,2,…,�],表示协变量漂移、先验漂移和概念漂移等。数据传输的演化更新集U=[�1,�2,…,��]，每个更新��都有一个方法��∈[0,1,2,…,�]，表示校准模型、和主动学习或迁移学习等方式。用户需求服务集�=[�1,�2,…,��]，表示用户提�动态的需求和任务；是一个动态的集合。 �为算力存储资源、网络资源，以及数据隐私等各种资源约束阈值；�表示每个流程中对应消耗和占据的资源函数。考虑体系化人工智能的内部流程和逻辑，进一步可以将�分解为以下几个子函数： max�(�,ℎ,�,�,�,𝑃,�) �.�.�(�,ℎ,�,�,�,𝑃,�)≤� 其中：端到端跨模态异构数据建模：�(D,M)；模型学习机理的优化建模：ℎ(�,�,�,�)；模型的原子化表征和建模：�(M,E)；模型的标准规范入库：�(M,S)；数据漂移的优化建模：�(D,�,F)；模型数据传输的演化更新：𝑃(M,F,U)；运行架构优化建模：�(�,�,�)，如何在资源约束和安全可信的前提下的完成整体业务流程。 原子化 端到端优化 基于大模型的调度体系 Fig1.体系化原子模型示意图(HAIAtomicModel，HAI-AM)其中绿色部分为其中一条可能的路径模型介绍模型的类型（通用型，特定任务型），模型结构及参数量，应用领域，模态，构建时长及机构功能描述主要完成的功能描述和列表输入输出输入输出样例可以是一对多，一对一，多对一等组合接口模型的前向和后向接口及信息适配器适配器选择性能准确率性能，准确率，及测试方法约束应用环境的约束条件。原则（1）重用度高（2）输入输出清晰，功能清晰（3）不过于细小导致模型协同成本高于计算成本（4）适合于独立攻关（5）和基础模型能力互补基础模型的功能解耦 AutomaticMaskPruning(AMP):automaticallyidentifytask-specificfilters/nodesfordifferenttasksinthepre-trainedmodel. applytheLogExpectedEmpiricalPrediction(LEEP)whichisusedtoevaluatethetransferabilityofrepresentationslearnedbythesourcetasktothetargettask. ScalableMaskSelectionPruning(SMSP):fast-adaptthepre-trainedmodeltodownstreamtasks. One-ShotPruningforFast-adaptingPre-trainedModelsonDevices,HaiyanZhaoandGuodongLong，arXiv:2307.04365v1 DecoupleoneModelintoAtomizednetworks “FactorizingKnowledgeinNeuralNetworks”,XingyiYang,JingwenYe,XinchaoWang,ECCV2022. •知识分解：包含结构分解和表征分解 •每个因子网络包含两部分：通用知识网络（CKN）和特定任务网络（TSN） •一种新的信息衡量指标-InfoMaxBottleneck(IMB)，使输入和通用特征间互信息最大（最大限度保留大模型的通用知识），使不同特定任务特征间互信息最小（使特定任务网络之间尽可能解耦）。模型蒸馏 "Generic-to-SpecificDistillationofMaskedAutoencoders".WeiHuang,ZhiliangPeng,LiDong,FuruWei,&JianbinJiao,QixiangYe.(2023).15996-16005.10.1109/CVPR52729.2023.01535 基础模型的功能蒸馏 PredictedEmbeddingℎ1 ℎ2ℎ3ℎ4 <EOS> PredictedEmbeddingℎ1 ℎ2ℎ3 ℎ4<EOS> GenDistiller Frozen GenDistiller

点击免费查看完整报告

你可能感兴趣

张世磊：体系化人工智能技术（Holistic AI）技术探索

你可能感兴趣

【盘中宝】该国首位AI教师正式上岗，人工智能技术融入教师教育教学是大势所趋，这家企业已就“AI教育”应用场景开展探索-20240311

张世磊-人工智能大平台与九天·众擎基座大模型的建设与实践-中国移动江苏公司2023 DICT生态合作大会-人工智能与智慧运营中心

【盘中宝】个人信息保护在迎重磅催化，网安与AI技术融合，驱动市场加速爆发，这家公司已将人工智能技术应用到相关产品

人工智能技术应用实践白皮书：数字经济时代AI加持下的技术与业务创新

计算机行业快报：AI应用精彩纷呈，技术探索永不止步