Jul.2023 中国市场大模型 落地进展与趋势洞察 更多报告请关注公众号:全球行业报告库 目录Contents 01. 中国市场大模型进展与趋势 中国大模型市场全景地图国产大模型市场机会 企业落地大模型路径 02. 大模型在企业用户落地进展 企业用户对大模型的预期大模型在行业落地进展大模型在企业落地方式 03. 大模型在科技厂商落地进展 大模型对科技厂商的价值 大模型在数据分析、营销、办公的落地案例 01 中国大模型市场进展与趋势 中国大模型市场全景地图 国产大模型市场机会 企业落地大模型路径 更多报告请关注公众号:全球行业报告库 大模型定义 大模型:参数量超过10亿、具备泛化能力的模型,可以被称为大模型。 大模型 小模型 AI建模方法 深度学习、自然语言处理、多模态技术 机器学习、深度学习、自然语言处理、计算机视觉等 参数量 参数量规模在10亿以上 参数量规模是几万至几百万参数 应用场景 泛语言类场景(自然语言、编程语言等)、多模态场景(文本、图像、音频、视频) 场景更加多样,但生成类场景效果差,不具备多模态 泛化能力 强,处理多任务效果好 弱,处理多任务效果差 可解释性 弱 强 训练 冷启动成本低任务对齐成本高 冷启动成本高任务对齐成本低 推理 反馈速度慢准确率低 反馈速度快准确率高 大模型当前以生成类应用为主,多模态是未来重点发展方向 企业用户是从应用视角出发,分成生成类应用、决策类应用和多模态应用。受限于模型能力、应用效果等因素,当前阶段以生成类应用为主。 生成类应用 对话式交互内容生成代码开发虚拟专家智能体 决策类应用 辅助决策:描述、诊断智能决策:预测、指导 多模态应用 图像、语音、视频、结构化数据 大模型能力 推理 生成 理解 更多报告请关注公众号:全球行业报告库 向量数据库 存储 高速网络 AI芯片 云平台 任务大模型 企业大模型 领域大模型 行业大模型 通用大模型 …… 提示词工程工具 数据标注工具 大模型应用开发工具 IS V 独 ⽴ 软 件 服 务 商 SI 系统集成商 MSP 运维服务商 基础层 模型层 中间层 对比美国市场,中国市场在模型层和应用层发展迅速 应 ⽤层 金融 能源 教育 出海 传媒 电商 医疗 政务 …… 营销 客服 应用开发 数据分析 …… 三大要素,驱动中国“OpenAI”(通用大模型)必定出现 国产化 本地部署 服务支持 国产化: 从IT基础设施到上层应用软件的国产化、自主可控需求强烈。银行、大型央国企在内部明确限制员工使用ChatGPT用于内部办公、生产场景,5家银行在1年内有明确采购国产大模型服务的计划。 客群特征: 以央国企等集团型企业为主的客群,集团层面要进行大模型能力建设,有明确购买/自研通用大模型的需求。 本地部署: 从数据安全角度出发,银行、大型央国企如果将大模型用于生产,必须要进行本地部署。 根据爱分析调研,除了部分企业基于开源自研之外,绝大部分国内企业用户和应用厂商, 都在等国产大模型的商业化落地,这是国产大模型最核心的驱动力。 更多报告请关注公众号:全球行业报告库 市场成熟度、监管要求、数据安全等因素推动行业/领域大模型发展 监管要求 服务支持 市场成熟 度 数据安全 监管要求: C端应用短期不会放开,更多应用场景在B端。 数据安全: 大型甲方企业数据安全考虑,特定场景的SFT数据获取存在一定难度。 FT数据量不大,但需要有很深的行业know-how,获取难度不低。通用大模型优先训练通用场景FT数据,特定场景积累需要时间。 市场成熟度: 很多甲方企业在23-24年有明确上线大模型需求,当前国产通用大模型能力不足。 服务支持: 中国企业客户需要端到端服务,倾向于采购行业大模型+业务应用,几乎不可能直接采购通用大模型,需要有很强的区域服务支持能力。 更多报告请关注公众号:全球行业报告库 大模型能力建设和应用场景探索是当前企业用户落地大模型的主要路径 集团企业重点是大模型能力建设,一般企业/部门重点是应用场景探索。 大模型能力建设分成三个层面:基础设施建设、大模型训练和大模型应用,当前以基础设施建设和大模型训练为主。 基础设施建设 芯片(算力) 大模型训练 模型选型 模型训练与微调 大模型应用 模型压缩 大模型与小模型结合 综合成本和安全性考虑,智算中心会成为解决算力问题的重要方式 投入产出比 自建集群云服务租用 性价比高安全性差 成本高 AI团队要求高安全性高 智算中心 智算中心 云服务租用 成本低于云服务安全性强 自建集群 安全性 当前以SFT为主,未来预训练会成为主流 SFT试错成本低,成为多数企业的选择。 未来随着基础/通用模型成熟和算力持续降低,模型预训练成为主流方式。 SFT 预训练 投入 算力成本低 算力成本高团队需要具备模型训练经验 数据集 SFT精标数据 SFT精标数据大量无标注数据集 模型能力 受限于模型本身能力 能力增强,但可能出现灾难性遗忘 安全性 受限于模型自身数据集,只能尽可能弥补安全问题 很大程度上解决安全性问题 未来发展 迁移成本低 受限于基础大模型,迁移成本高 当前以小模型为主,模型级联是未来主要应用方向 分成三种形式,现阶段以(1)和(2)为主:1)小模型为主,大模型提升小模型的开发效率; 2)大模型与小模型级联,小模型连接应用,大模型增强小模型能力; 3)大模型与小模型融合 以小模型为主 大模型提升小模型训练效率 降低数据标注成本 大模型与小模型级联 安全性、性价比、准确度 大模型提升小模型的理解和生成能力 大模型与小模型融合 当前主要探索方向 02 大模型在企业用户落地进展 企业用户对大模型的预期 大模型在行业落地进展 大模型在企业落地方式 多数企业认为大模型将带来变革性价值,但应用场景尚需挖掘 调研行业分布 16% 9% 7% 6% 4% 4% 3% 1% 1% 1% 1% 金融消费品零售 能源汽车制造央国企 信息技术 媒体 43% 是否关注需求及来源 28% 72% 关注不关注 •大型央企等控股集团从高层推动,其他企业多从IT等部门自下而上推动 85% •能源、金融、消费品零售、汽车等行业最为关注大模型 当前阶段预期业务价值 15% 高层 部门中层 16%0% 地产 交通化工咨询 39% 45% 观望学习探索可研试点应用全面应用 12%5% 40% 43% 变革性高 中低 •在金融、消费品零售、能源、汽车等重点行业,对大模型现状进行了摸排调研 •大模型上线应用以内部生产力工具为主,对客应用囿于监管和大模型技术成熟度,尚需时日 •大多数企业对大模型预期业务价值抱有高期待 附录:预期业务价值释义 •创造新的业务模式,并实现新的业务收入来源 变革性 中 •在既有业务模式下,业务流程有所改善,并带来收入增长或成本下降 高 •在既有业务模式下,业务价值得以显著增强或业务流程得以重塑, 从而明显增加收入或者降低成本 预期业务价值由高向低 低•用户体验改善等业务微调,难以与收入增长或成本下降直接关联 大模型可分为生成和决策两类应用场景,决策场景预期业务价值更高 生成场景 对话式交互 •通过自然语言与用户进行交互•典型场景:聊天机器人 •在特定领域,通过对大量的非结构化数据总结,为用户提供专业意见 •典型场景:智能客服 虚拟专家 内容生成 •生成用户需要的文字、图片、音频、视频、3D模型等 •典型场景:AI绘画 代码开发 •对已有代码检查、修正,或根据要求生成代码 •典型场景:代码生成 智能体 •通过对话,调用内外部数据,满足用户目标,短期内难实现 •典型场景:Auto-GPT 辅助决策 智能决策 •通过数据采集和展示,描述业务正在发生什么,实现业务可视化 •典型场景:数据大屏 •通过数据分析发现业务现象背后的原因,实现业务可诊断 •典型场景:数据分析 •通过数据分析,判断业务未来会可能会发生什么,实现业务结果可预测 •典型场景:机器学习平台 •通过数据分析建模,由系统直接给出能达成预期业务目标的行动方案 •典型场景:智能决策系统 决策场景 描述诊断预测指导 基于大模型构建的AI原生应用,有望创造变革性价值 预期业务价值高或中 在既有业务模式下,增强或改善业务流程,带来收入增长或者成本下降 预期业务价值变革性基于大模型,创造全新业务模式,并实现新的业务收入来源。只有大模型才具备涌现能力、泛化能力,从而跳脱出在系统中的模块局限。 小模型时代,系统中只有部分模块为AI替代。AI应用场景切割的很细,工行1,000+场景、3,000+模型。 大模型时代,整体系统具备AI能力,创造全新业务。 能源、银行两大行业,大模型落地进展最快 场景丰富度 智能风控 审计助手 智能营销 证券智能投顾智能投研智能客服 能源 智能客服 设备运检知识助手 检修文档生成 智能问答 智能客服数字营业厅贷后报告生成 沉睡客户唤醒 银行 高 金融产品推荐 电力系统仿真平台 电力负荷预测 中 制造 智能问答研发设计辅助 低药企 药物研发 主机厂自动驾驶智能座舱 媒体 摘要生成 消费品零售 智能客服千人千面文案营销图片生成 导购赋能 写作助手智能问答 出海 智能客服 观望学习探索可研试点应用全面上线 所处阶段 能源企业生成类场景落地速度快,高价值应用聚焦决策类场景 电力系统仿真平台 电力负荷预测新能源规划设计 设备故障维修资金归集设备预测性维护 设备运检知智能客服/检修文档生成识助手虚拟营业厅 场景价值变革性 高 中 低 1年内实现1-3年实现3年以上实现 生成类 决策类原生应用 大模型带来的场景价值变化 主流采纳时间 注:主流采纳时间,指被行业内企业用户主流采纳应用的时间。 大模型基于设备日志等运行信息进行故障定位,有望成为首个中价值场景 过去:基于Bert模型的智能客服 现在:利用大模型改善智能客服的用户体验 设备运检知识助手智能客服/虚拟营业厅 预期:用户体验改善 实际:意图理解更准确、语言更拟人化 过去:基于NLP技术构建结构化知识库 现在:利用大模型构建运检助手 案例对比 案例对比 预期:效率改善 实际:提取效率和效果、交互方式有优化 场景价值 场景价值 检修文档生成设备故障维修 预期:故障快速定位与修复 实际:尚未实现,未知 过去:传统故障检修方法难度大、耗时耗力 现在:大模型快速定位故障原因,提供检修建议和方案 过去:模板式文档填写 现在:利用大模型快速自动生成文档 案例对比案例对比 预期:效率提升 实际:尚未实现,未知 场景价值 场景价值 预测类决策场景是未来高价值场景 过去:AI算法故障预测能力弱 现在:大模型可以提取潜在故障特征,实现对电力设备故障预测 电力系统仿真平台设备预测性维护 预期:丰富仿真样本库 实际:尚未实现,未知 预期:提高设备故障预测准确率 实际:尚未实现,未知 过去:MATLAB等电力仿真工具 现在:利用大模型自动实现仿真样本补充和样本分布改造 案例对比 案例对比 场景价值 场景价值 过去:新能源供电不稳定,分配不同类型新能源电站 强依赖专家经验 现在:利用大模型规划电站建设最优解 电力负荷预测新能源规划设计 预期:提高供给侧规划准确率 实际:尚未实现,未知 预期:提高预测准确率 实际:尚未实现,未知 过去:负荷预测考虑实时影响因素少 现在:纳入更多影响因素实时预测负荷 案例对比 案例对比 场景价值 场景价值 银行重视大模型在营销、风控、运营三个方向应用价值 数字营业厅 沉睡客户唤醒金融产品推荐 个性化资产申请/交易反欺配置诈 智能客服营销图片自 动生成 智能问答助手贷后报告撰写 场景价值 变革性 高 中 低 1年内实现1-3年实现3年以上实现 生成