业 行DONGXING 研究 SECURITIES 东兴 券 股 证如何看待华为盘古大模型5.0? 份 有——科技龙头巡礼专题(一) 限公司 分析师 刘蒙 执业证书编号:S1480522090001 分析师 张永嘉 执业证书编号:S1480523070001 分析师 石伟晶 执业证书编号:S1480518080001 研究助理 李科融 执业证书编号:S1480124050020 证分析师刘航执业证书编号:S1480522060001 券研究报告 东兴科技团队 2024年11月15日 摘要 Q1:华为盘古大模型为何能在AI领域中异军突起?得益于四大关键因素:(1)技术创新显著,包括针对复杂3D气象数据的三维神经网络与层次化时域策略,以及在全系列、多模态、强思维方面的全面升级,提升了模型的理解与规划能力。(2)基于华为自研达芬奇架构,盘古大模型拥有强大计算能力,能高效处理大规模数据,并广泛应用于智能问答、医疗、金融等多个领域。(3)华为云全面建设盘古大模型全域协同生态,与多家企业 签约合作,共同推动行业落地和应用。(4)华为持续加大AI研发投入,华为云构建了包括AI原生的云基础设施、数据湖和数据治理:、算法框架以及 AI开发平台和大模型的全栈工业AI能力,推动盘古大模型升级优化。 Q2:盘古大模型推出的背景和发展如何?华为出于对在人工智能兴起、数字化转型加速、市场需求多元化,结合自身的战略部署,以及竞争格局多元化的挑战的背景下,推出了盘古大模型。2024年6月21日,在华为开发者大会2024(HDC2024)上,由华为常务董事、华为云CEO张平安亲自揭幕,正式发布了盘古大模型5.0版本。 Q3:盘古大模型5.0有什么优势?与原先的盘古大模型4.0相比,华为盘古大模型5.0的优势可以从全系列、多模态和强思维三方面展开:(1)全系列升级:5.0版本推出了适配不同业务场景的多种规格模型,包括十亿级到万亿级参数的系列,分别适用于手机、PC端侧智能应用、低时延推理场景、复杂任务处理及跨领域多任务处理,满足多样化的业务需求。(2)多模态升级:5.0版本不仅支持文本、图片、视频等常见模态,还新增了对雷达、 红外、遥感等模态的支持,且在多模态理解和生成能力上均有显著提升,尤其在自动驾驶、工业制造等领域有广泛应用前景。(3)强思维升级:5.0版本在数学能力、复杂任务规划能力和工具调用能力上均有所增强,能够更好地处理数学问题、规划复杂任务及调用各种工具和资源,从而成为更高效的行业助手。 Q4:盘古大模型5.0有什么最新看点?2024年10月,中国信通院人工智能研究所联合40余家业界单位共同编制《面向行业的大规模预训练模型技术和应用评估方法第6部分:政务大模型》。华为云盘古大模型2024年首批参与对应测评,顺利完成政务大模型标准符合性验证,获当前业界最高卓越级(5级)评分。盘古政务大模型在模型平台、模型微调、模型能力、内容安全四项技术领域以及服务能力与生态合作,共计六项评估指标取得满分, 成为本次评估中唯一技术+服务领域全部评估指标满分的厂商。 Q5:盘古大模型5.0的推出,哪些标的有望受益?华为盘古大模型5.0的发布将推动AI产业发展,包括硬件、服务、行业应用及产业链相关企业将会受益。受益标的:科蓝软件、拓维信息、常山北明、软通动力、博彦科技、梦网科技、数字政通、神州数码、光环新网、赛意信息、彩讯股份等。 风险提示:市场竞争加剧、AI监管政策的收紧、算力资源不足、AI领域发展进度及需求不及预期。 Q1 盘古大模型为何能在AI领域中脱颖而出? 1.1.盘古大模型为何能在AI领域中脱颖而出? 盘古大模型 盘古大模型在处理复杂、不均匀的3D气象数据时,创造性地提出了适应地球坐标系统的三维神经网络(3D 盘古大模型集成了华为云团队在AI领域数十项研究成果,并且受益于华为的全栈式AI解决方案,与昇 腾(Ascend)芯片、昇思(MindSpore)语言、ModelArts平台深度结合。 Earth-SpecificTransformer),并使用了层次化时域聚合策略来减少预报迭代次数,从而减少迭代误差。这一创新使得盘古大模型在气象预报领域取得了显著成果,并在《Nature》正刊上发表了相关研究成果。 技术创新与突破 三维神经网络与层次化时域聚合策略全系列、多模态、强思维 计算能力与应用场景 基于华为自研达芬奇架构广泛的应用场景 ISV生态建设 生态建设与合作伙伴 与鸿蒙系统的协同 华为云的全栈AI能力 华为云构建了包括AI原生的云基础设施、数 华为云在toB和toG领域有着深厚积累,同时多年来致力于ISV(独立软件提供商)的生态建设。中软动力、软通动力、南威软件等深 耕各行业的软件服务商都是华为云的合作伙伴, 共同推动了盘古大模型的行业落地和应用。 鸿蒙系统作为华为面向万物互联时代的原生操作系统,与盘古大模型形成了良好的协同效应。 据湖和数据治理、算子库、算法框架以及AI开发平台和大模型的全栈工业AI能力。其云基础设施架构CloudMatrix将CPU、NPU、DPU、存储和内存等资源进行了全面互联和池化,为AI应用提供了强大的算力支持。 资料来源:华为官网、Nature、凤凰网、中国基金报、网易、CSDN、东兴证券研究所 1.2.盘古大模型的架构 L0、L1、L2三层架构 L2层是盘古大模型的最上层,包含了可以让用户自主训练的 传送带异物检测、重介选煤洗选、政务热线、城市事件处理、台风路径预 1更多细化场景模型。这些模型是基于L1层行业通用大模型进 一步细化和定制化的结果。 L1层是基于L0层基础大模型进一步开发的行业 2通用大模型。这些模型针对特定行业进行了优化和微调,以适应不同行业的特定需求。 L0层是盘古大模型的基石,包含了五 3个基础大模型,这些模型是构建更高级别模型的基础。 解决行业难题, 4 释放AI生产力 L2场景模型 L1行业大模型 L0基础大模型 盘古大模型 测、自动驾驶研发、车辆辅助设计、 辅助医疗、数字人直播、智能运维等 盘古矿山大模型、盘古政务大模型、盘古气象大模型、盘古汽车大模型、盘古医学大模型、盘古数字人大模型、盘古研发大模型 盘古自然语言大模型、盘古多模态大模型、盘古视觉大模型、盘古预测大模型、盘古科学计算大模型 重塑行业 技术扎根 开放同飞 资料来源:每日经济新闻、东兴证券研究所 1.3.海外龙头对标:GPT-4Turbo模型 GPT-4-Turbo的优势 GPT-4-Turbo的优势包括:增强的上下文处理能力(可处理高达128K个token),更新的知识库(包含至2023年12月的信息),更低的成本效益,以及新功能集(如JSON模式、可复现输出等),这些使其在处理复杂任务时更准确、高效,并吸引更多开发者使用。 主要优势 抓住机遇 启示 根据OpenAI自己发布的最新测试结果,从这个评测看,在数学图例方面,GPT-4-turbo-2024-04-09版本的模型 •AI技术快速发展 •上下文处理能力 •模型规模 •知识库 都有不同程度的提高, 最高可以提升19% 对盘古大模型的启示 华为盘古大模型可从GPT-4-Turbo的成功 •市场需求 •OpenAI品牌影响力 •成本效益 •新功能集 中汲取经验,注重技术创新与升级,紧 密贴合市场需求,加强品牌建设,并积 极推动应用落地。 启示抓住机遇主要优势 资料来源:OpenAI、数据学习、网易、电子技术设计、东兴证券研究所 Q2 盘古大模型推出的背景和发展如何? 2.1.华为云盘古大模型推出背景 2024年10月,世界经济论坛(WEF)公布我国有72家入选“灯塔工厂”,占全球“灯塔工厂”总数的 42%,位居全球首位。 数字化转型趋势 市场需求多元化 •技术融合与创新 •新兴应用场景不断涌现 •定制化需求增加 •行业应用广泛 小数据与优质数据应用、人机对齐技术、可解释性模型增强、大规模预训练模型优化、全模态大模型发展、具身智能与实体AI系统、以及量子计算与AI的结合等,这些创新正引领AI技术迈向新高度。 技术创新与突破 截至2023年,我国AI大模型行业规模已达到147亿元,且近三年复合增速高达114%。金融、政府、影视游戏和教育领域是大模型渗透率最高 的四大行业,渗透率均超过50%。预计到2028年,我国AI大模型行业的市场规模将突破千亿元, 五年复合增速将超过50%。 AI技术逐渐成熟 华为基于鲲鹏与昇腾两大基础芯片族,构建了包括欧拉、鸿蒙等基础软硬件在内的开源开放生态。其中,鲲鹏面向通用计算,昇腾面向人工智能计算。 产业生态构建 竞争格局多元化 国内市场:大模型发展势头尤为迅猛。大型语言模型可分为四大竞争派系:互联网公司(如百度、阿里、腾讯、华为等)、AI公司(如澜舟科技、昆仑万维等)、学术及科研机构(如清华、北大、中科院等)以及行业专家团队初创公司。目前国内已 经有300多个AI大模型,同台竞技。 资料来源:人民网、前瞻网、CSDN、《瞭望》(郭方达)、澎湃新闻、中国科学技术协会、网易、东兴证券研究所 2.2.盘古大模型发展历程 盘古大模型是由华为公司开发的一款基于深度学习和自然语言处理技术的中文AI模型,涵盖了自然语言处理(NLP)、计算机视觉(CV)和科学计算等多个领域,拥有超过1.7万亿个参数,是目前世界上最大的中文AI模型之一。盘古大模型采用完全的分层解耦设计,包括L0层的5个基础大模型、L1层的N个行业通用大模型、以及L2层可以让用户自主训练的更多细化场景模型。 持续优化 面向行业的全面升级华为云以昇腾AI云服务为 持续创新与突破 2024年6月21日,盘 立项与研发 华为开始在华为云内部立项盘古大模型项目。 首次发布 盘古大模型正式对外发布。 技术深化与领域拓展 盘古大模型2.0版本发布。华为与能源集团等合作伙伴开始将大模型初步应用于企业、工业和科学研究。 华为云盘古大模型3.0正式发布。盘古大模型3.0是完全面向行业的大模型,采用了“5+N+X”的三层架构包含L0基础大模型、L1行业大模型及L2场景模型三层架构。 算力底座,以盘古大模型联合创新为基础,以模型社区和全面升级的云学堂为双引擎,携手伙伴、开发者合作共建“百模千态”。 古大模型5.0正式发布。 该版本在全系列、多模态、强思维三个方面进行了全面升级。 2023 2024 2020 2021 2022 2023 资料来源:华为官网、环球科技网、百度百科、CSDN、东兴证券研究所 Q3 盘古大模型5.0有什么优势? 3.1.盘古大模型5.0的突出优势 华为自研盘古大模型,跳级迭代:Pangu3.0 Pangu5.0 包含了不同参数规格的模型,以适配不同的业务场景。从十亿级参数的PanguE系列到万亿级参数的PanguS系列,分别适用于手机、PC端侧智能应用、低时延推理场景、复杂任务处理及跨领域多任务处理,满足多样化的业务需求。 全系列升级 Pangu5.0 强思维 华为云通过优化昇腾AI云服务,显著提升了模型训练的稳定 算力高效 性和效率,如万亿参数模型训练可40天无中断,集群故障恢 复时间缩短至10分钟。此外,华为云创新推出CloudMatrix云基础设施,实现多元算力对等全互联,将AI算力从单体提升至矩阵级别。为解决“内存墙”问题,华为云还发布了EMS弹性内存存储服务,利用显存扩展等技术释放极致算力。 升级 多模态 升级 不仅支持文本、图片、视频等常见模态,还新增了对雷达、红外、遥感等模态的支持,且在多模态理解和生成能力上均有显著提升,尤其在自动驾驶、 盘古大模型5.0的 数据高效 华为云已经从盘古3.0时代的3TTokens的数据,演进到了 盘古5.0的10TTokens的高质量数据,其中合成数据占比超过了30%。盘古大模型5.0采用了优质的、面向高阶能力的数据