Oalysys易观 激发科技与创新活力 大模型对企业数智化升级与业务经营的影响与应对 易观智慧院 2023年6月 本产品保密并受到版权法保护 ConfidentialandProtectedbyCopyrightLaws 大语言模型开启AGI时代,人工智能进入生成式阶段 什么是大模型? Onalysys易观 激发科技与创新活力 大语言模型/基础模型训练过程 大语言模型(LLM)是建立在大量数据集上2C4= 预训练的巨大模型,包括如下关键要素; ·海量算力与数据支撑的大参数 “涌现”智能能力,拥有解决它从未或 13 架构设计模型预训练指示学习AI对齐产品封装 极少见过的问题的能力基于Transformer架构,基于海量数据进行模型在多类型下游任务上进持续探索更有效率的方式 预训练,仅需要少量数据的微调基甚至无 需微调,就能够解决多种通用型任务 规划技术路线,①编码训练,并形成一个有监行训练,提升其少样本/实现模型与人类社会普世器路线;②编解码器路督的策略,引入奖励模零样本能力价值观的对齐,从而达到线;③解码器路线型和RLHF进行强化学习生产环境部署要求 大语言模型关键能力人工智能与AGI发展阶段划分 A 语言能力知识能力分析式人工智能一→生成式人工智能 包括语义理解,语言生成,包括事实性知识,也包括常 多轮对话,乃至快速形成文识知识等 思维革命 本摘要的能力 AGI1.0 交互革命·知识革命AI具备独立思考与逻辑判 逻辑与复杂问题推理能力通用任务能力 ,人机交互方式: ,语言是知识的载体,未 断的能力 利用上下文学习与思维链能从以往单一模型解决对应问 GUIDUI/HUI来模型人人可训、人人进一步延展,具身智能连 力,持续对大模型进行训练题,过渡到一个模型,解决Prompt工程价值凸显可用,即个人知识能力接物理世界,硅基生命与 与微调,从而提升大模型的多种通用任务将得以复制和扩展碳基生命共存 复杂问题推理能力 AGI0.1AG2.0 2023/6/26激发科技与创新活力2 大语言模型推动企业从数字化向智能化升级 大模型对企业带来的核心价值是什么? Onalysys易观 激发科技与创新活力 中国企业部署AI应用所面临的挑战 缺乏技术人员 51.7% 缺乏质量高的数据集 51.7% 应用场景不明确 45.5% 投资A/项目的成本32.9% 业务方的参与与支持 以业务驱动的方式拥抱A 人工智能从未如ChatGPT这般普及,超过1 亿用户主动体验的背后,是业务发展需求驱 01动AI应用场景探索与实践的重大转变 降低AI开发门槛 传统的AI开发模式需要针对不同的任务和场 23.1%景进行定制化开发,大模型显著降低开发复 算法的可解释性22.4% A/安全、伦理与合规问题15.4% 02杂度,提升部署与应用的便捷度 其他2.1%增强用户体验,碾平企业数智化洼地 0.0%10.0%20.0%30.0%40.0%50.0%60.0%大模型对于人机交互方式的变革显著增强客 数据来源:埃森哲2020,易观整理户/用户体验与员工体验,有利于中后台赋能 升级,以及员工原生数智动能发展 @易观Analysyswww.analysys.cn03 2023/6/26激发科技与创新活力3 大模型应用尚未跨越鸿沟,尝鲜者重心在于技术突破与场景探索malysys易观 企业应用大模型可能面临的挑战与风险有哦些? 技术局限尚需突破方能释放更大价值 技与创新活力 知识更新与自主学习能力,目前大语言模型仍然为静态数据驱动的学习范式,无法实现新知识的快 速学习与选代,尤其是涉及到时效数据与专有数据的场景下存在障碍,OpenAl正在通过Plugins生 态来突破这一局限 垂直领域泛化能力,通用任务的卓越能力已经显现,但是进入垂直细分领域与知识体系下,大模型的性能与泛化能力仍然需要增强,行业大模型训练是当前挑战的破局之道之 长期记忆能力,目前正在通过增大上下文容量、数据向量化,以及Alagent等多种方式探索突破 巨大的模型训练与推理算力等成本拉低效益比 训练与微调成本,该训练成本仅针对企业应用基础模型结合行业知识与数据集进行训练与微调的成 大模型应用曲线 技术能力场景摸索大规模产业化 跨越鸿沟 彰显,面临落地,发挥 巨大成本挑战业务价值 2 本,并非基础大模型训练成本,与上述“垂直领域泛化能力”相对应,该成本仍然为行业知识壁垒价值曲线显著的企业必须承担的成本,开源基础模型在一定程度上可以降低这一阶段的训练成本 推理成本,大模型在参数体量巨大的情况下,仍然存在较高的推理成本,这方面可以通过模型压缩与剪枝等技术的发展进一步降低 模型能力与业务场景的适应成本,这部分成本虽然由于人机交互方式的变化显著降低,但是前期仍然需要考虑提示工程在特定场景的磨合成本 安全合规可信应用底线尚需刚性保障 模型安全与可控制性问题,这是人工智能普遍面临的问题,大模型并不能幸免,包括模型攻防、数 据注入等问题;同时,模型能力来自于“涌现”,需要进行模型能力,尤其是生成结果的可控制, 方能进入到生产环境 3对齐问题,既包括人工智能与人类社会价值观保持一致,也包括与不同国家价值观,不同类型企业经营以及商业法则相匹配等,前者最为关键,这也是目前最为关注的AI不受控制的风险之一,目前 在通过RLHF与RLAIF不同方式来实现成本曲线 隐私与数据安全问题,无论是大模型的训练推理,还是对话应用的过程中,都存在过多的隐私暴露与数据安全风险,这有赖于技术突破和监管合规的进一步建立 2023/6/26激发科技与创新活力 大模型所加速的生成式人工智能已经渗透到多个场景 生成式人工智能,到底在生成什么,应用到哪些场景? 0101 Onalysys易观 激发科技与创新活力 文本 代码 图像 音视频 3D 分子发 ·对话/问答 自然语言生成代码 图像分类/分割 信息播报 电影/游戏/动画制作 药物设计 文档/文本/文案生成 ·代码补齐 工业设计 语音编辑/翻译 建筑/家居设计 材料科学 现 生成SQL 医学影像标注与解部影视内容分析编辑 工业制造 食品与 生成软件测试用例 结果构建 视频增强/风格迁移 工业/艺术设计 能源 .内容/会议摘要等农业 语言翻译 文学/剧本创作等·合成数据等艺术/商业作品创作音乐/视频生成医疗健康个人护理等 图像修复虚拟现实等 天文观测、卫星遥感 观测等 010203040506 2023/6/26激发科技与创新活力5 大模型能力与AIGC相结合向企业经营关键环节渗透 企业可以考虑惠从环节应用大语言模型? Onalysys易观 激发科技与创新活力 职能渗透 AI+营销/客服AI+OAAI+财务AI+HRAI+研发AI+供应链 营销物料生成 工作助手 财务决策 招聘/面试 代码编写 销售分析与预测 智能广告投放 会议管理 财务风险管理 员工管理 产品测试 仓库管理 智能客服 +Office助手等 报表编制 人才培养 3D建模等 订单履约 智能营销等 日常流程处理等 离职预测等 风险预警等 ★★★★★★★★★★★★★★★★ 核心场景协同办公知识管理内容生成数据分析 关键能力 语言能力 (含生成能力) 知识能力逻辑与复杂问题推理能力通用任务能力 2023/6/26激发科技与创新活力6 行业应用全面铺开,实践案例示范价值在于效益比测算与优化 大模型与AIGC在不同行业的应用场景分别如何? 金融行业电商/零售行业娱乐/游戏行业 nalysys易观 激发科技与创新活力 前端对客的核心价值与场景主要为提升服务体验,包括智能核心价值目前主要体现在面向用户运营侧的服务体验提升:包括影视视频、游戏等在内的娱乐行业是高度依赖于内容资营销、智能客服等方面,同时也在中后台运营管理方面,例以及营销运营过程中的内容生成与提效,主要应用场景包括产行业,包括图像、音视频、3D资产等,借助于大模型与 如信贷审批、核保理赔等流程性任务层面提升工作效率智能客服、商品海报与文案生成等AIGC能力首先提高内容生产效率是当务之急 ·智能投研与投顾、智能财富管理与量化交易等金融特定任务,中期数字人赋能用户营销正在提速,长期来看将从前端向中,无论是影视还是游戏,都在营造世界观与价值观的过程中需方面则需要进行金融大模型的训练与微调,探索创新价值后台乃至供应链与产品研发延伸要故事线的引导与文本对话的链接,相对应地,短期看文本 与对话生成等,中长期看智能NPC乃至游戏策路设计 实验用时:中国收业银行ChatABC,应儿于多整时活,内宽商空等场票实购里通文大模型商家,AIGC生3D商品与店辅营用 实时元芭界温鸡A咖决方浆 Aingt 教育行业工业/制造医药/医疗 ·围绕受教育者与C端用户:覆盖K12、高等教育、职业教育工业/制造行业是知识密集型行业,尤其是进入到工业细分“AI+医疗”主要应用场景与价值在于电子病历生成与分析、等不同类型,主要侧重于提升交互体验以及个性化教学方面行业,知识密度与信息壁垒,包括工艺、成分、流程等,都AI辅助诊疗,包括AI影像识别与临床辅助决策等,赋能医生展开高度差异化,相应地,工业行业大模型的必要性基高与医疗机构提高平均专业水平,提高工作质量与效率 :围绕赋能教育机构与施教者/老师:覆盖备课、教学、考试目前主要在AI辅助研发设计、工业质检(即质量检测与缺陷·新药研发利用语言模型等进行靶点发现、化合物筛选、临床评测与学生管理多个环节,在原有教育信息化的基础上进行分析)、生产流程智能化等方面应用,未来则需要探索AI+实验研究等,尤其是在药物发现环节充分发挥探索性价值智能化升级机器人的智能化升级,用大模型链接物理世界 实:韩大道飞品火大模型回能教方行业实新动智人工智技及冷智孔厂应服实游年为基于PaigDngHodei股供A物药物M安平台,最兰新药M发全范程 让入象老一托批改作文 2023/7/12激发科技与创新活力 美昌国 科技与创新活力 企业拥抱大模型,从应用场景入手探索最佳实践再规划自建路线halysys易观 如何对大语言模型(LLM进行部署与应用? 自建MaaS能力,实现技术驱动灵活应用AI能力,赋能业务经营 适用于数智技术驱动的行业,同时,企业IT投入与研发能力相对比较适用于大多数企业,IT能力建设并非重点,但是需要利用AI能力提效 强,能够将科技能力作为重要竞争力的行业与企业降本,赋能业务经营 134 端到端自主训练大语言模型 利用开源模型,或者与LLM供应采购或者利用开源大模型API调整目前企业应用的选型策略: 有模型 商进行联合研发与微调,训练专利用向量化方式,优化自身应用提升AI能力评价权重 关键考量:关键考量:与方式②相比,算力资源投入相对较适用于大多数企业拥抱数智化的场景, :具备高算力资源基础·算力资源基础与投入仍为必须低,同时降低对于算法能力的要求是企业软件AI能力的整体升级 ·高密度AI工程化团队·基础模型选型,或LLM供应商选型关键考量:关键考量: :数据资源持续投入能力自有AI团队能力图谱与拓展,实现自身应用对于AI能力的抽象与对模·业务经营目标驱动 企业实践: 专有模型可持续运营与选代型的驾驭能力(Plug-in生态) 提示工程(PromptEngineering) 以头部科技企业为主,如百度、阿里、 ·专有数据储备沉淀与持续运营:专有数据沉淀与向量化处理能力能力 腾讯等,不仅自主训练大模型,同时 企业实践:企业实践: 更新企业软件选型标准与合作伙伴 对外输出模型服务;又如三星,出于 行业头部企业,例如中国工商银行、 中型企业在借力AI能力升级服务水平 企业实践: 自身应用需求和数据安全考量,进行Bloomberg等,进行金融行业专有模与平衡AI投入成本后普遍采取的方式钉钉接入通义千问全面升级协同办公大语言模型训练,尚未披露是否对外型训练,契合金融场景业务需求,实例如企查查通过向量数据库承载搜索智能化水平,变相提升企业智能协同输出相应服务现技术驱动引擎,将模型放在端侧进行部署,以与办公应用选型标准,包括HR、财务、 较低成本提升产品A/功能水平与品质客服等