证券研究报告|2023年10月30日 电子AI+系列专题报告(五) 华为盘古大模型:让AI重塑千行百业 行业研究·行业专题电子 投资评级:超配(维持评级) 证券分析师:胡剑 证券分析师:胡慧 证券分析师:周靖翔 证券分析师:叶子 联系人:詹浏洋 021-60893306 021-60871321 021-60375402 0755-81982153 010-88005307 hujian1@guosen.com.cnS0980521080001 huhui2@guosen.com.cnS0980521080002 zhoujingxiang@guosen.com.cnS0980522100001 yezi3@guosen.com.cnS0980522100003 zhanliuyang@guosen.com.cn 华为盘古大模型:让AI重塑千行百业 盘古大模型集成了华为云团队在AI领域数十项研究成果,与MindSpore(昇思)语言、ModelArts平台深度结合。 MindSpore(昇思)是华为开源自研AI框架,2023年MindSpore2.0版本实现全新技术升级,成为支持科学计算的AI融合框架,在基础能力上完成AI与HPC的融合,科学计算能力大幅提升。昇思MindSpore目前支持多种并行方式,可以原生实现大模型训练(类似于ChatGPT所使用的TensorFlow框架,其最大的核心优点就是支持昇腾芯片)。ModelArts是面向开发者的一站式AI开发平台,帮助用户快速创建和部署模型,管理全周期AI工作流,助力千行百业智能升级。ModelArts支持应用到图像分类、物体检测、视频分析、语音识别、产品推荐、异常检测等多种AI应用场景,通过全面的AI工具和服务,为业务智能快速创新赋能。 产业链相关公司:【服务器】工业富联、闻泰科技、环旭电子;【PCB】沪电股份、东山精密、鹏鼎控股;【算力】海光信息、寒武纪、全志科技;【存储】北京君正、兆易创新、深科技、江波龙、国芯科技;【先进封装】长电科技、通富微电、芯原股份;【AI终端】晶晨股份、瑞芯微。 风险提示:宏观AI推广不及预期,AI投资规模低于预期,AI服务器渗透率提升低于预期,AI监管政策收紧等。 目录 01盘古大模型简介 02 03 L0基础大模型 L1行业大模型与L2场景大模型 04 05 AI开发框架与开发平台风险提示 引言:华为鸿蒙4操作系统接入盘古大模型 2023年8月4日,在2023年华为开发者大会上,华为发布鸿蒙4操作系统(HarmonyOS4)。华为常务董事、终端事业部CEO余承东在发布会上称,华为盘古大模型,包括自然语言大模型、视觉大模型、多模态大模型,将会助力鸿蒙操作系统和鸿蒙生态。 鸿蒙系统于2019年诞生,定位为解决各智能设备间互联痛点的操作系统、满足全场景需求的操作系统。自鸿蒙系统首发以来,其已搭载在电视、手机、汽车等诸多终端中。据华为数据,截至2023年7月,进入鸿蒙生态的设备数量已超过7亿台,已有220万系统应用开发者投入到鸿蒙生态的开发中。据Counterpoint数据,鸿蒙系统在中国的市场份额已经达到8%,成为Android、iOS之后的第三大手机操作系统。 HarmonyOS4更新点之一在于融入了华为盘古大模型的能力,变得更加智能。AI大模型技术的发展将会带来下一代智能终端操作系统的智慧体验。 图:鸿蒙生态设备数量已超过7亿台 资料来源:2023华为开发者大会官网,国信证券经济研究所整理 图:华为发布HarmonyOS4操作系统 资料来源:2023华为开发者大会官网,国信证券经济研究所整理 引言:智能助手小艺基于大模型全面升级 HarmonyOS4新版本中的华为智慧助手小艺已经接入了盘古大模型,主要体现在多模态交互以及个性化创作两大能力。新升级的小艺可以实现更自然流畅的对话交互,拥有信息检索、摘要生成、多语种翻译等能力。 在多模态交互层面,小艺的交互方式从原先的语音交互增加了文字、图像以及文件等多种形式的输入。 小艺背后的大模型将会记住这些信息,由此用户可以通过小艺与这些信息进行“交流”,小艺会基于此帮用户完成部分任务。 在个性化创作层面,小艺背后的多模态大模型支持图像生成(包括文生图和图生图)、图像编辑以及图像理解三大能力。 用户可以通过与小艺问答交流来调用模型的AI能力生成与编辑各种风格的照片。 (根据官网进度,小艺部分功能将在部分机型通过后续HOTA升级支持。) 图:智能助手小艺能力全面提升 资料来源:2023华为开发者大会官网,国信证券经济研究所整理 一、盘古大模型简介 随着工业生产智能化需求不断上升,大量传统行业开始积累领域数据,并寻求人工智能算法以解决生产和研发过程中遇到的重复而冗杂的问题。人工智能算法在落地的过程中,将会面对大量不同场景、不同需求的用户,对算法的通用性提出很高要求。 近年来,随着国内云计算市场增速明显,企业上云明显提速,客户的需求逐步从“资源型需求”转向“智能型需求”及“业务型需求”。庞大的业务数量和场景种类多样性使得各行业各场景的云解决方案难度加大,单一的解决方案套路对于用户定制化需求已不具备优势。 传统封闭作坊式AI开发面临AI算法“碎片化困境” 图:AI进入千行百业所面临的挑战 资料来源:华为《预训练大模型白皮书》,国信证券经济研究所整理 传统“小作坊模式”:针对每个场景,独立地完成模型选择、数据处理、模型优化、模型迭代等一系列开发环节。 无法积累通用知识,面对不同领域的调试方法有所不同,开发模式比较低效。 特定的数据无法满足AI快速落地行业的需求。 当前人工智能领域存在大量专业水平不高的开发者,使得模型的精度、性能、可扩展性等指标难以达到最优。 人工智能算法落地的“碎片化困境”。 图:封闭的作坊式AI开发局限于特定的场景 资料来源:华为《预训练大模型白皮书》,国信证券经济研究所整理 预训练大模型解决AI模型通用与泛化的问题 预训练大模型:收集大量图像、文本等数据,利用无监督或者自监督学习方法将数据中蕴含的知识提取出来,存储在具有大量参数的神经网络模型中。遇到特定任务时,只需调用一个通用的流程,就能够将知识释放出来,并且与行业经验结合,解决实际问题。 预训练大模型能够解决在没有基础模型支撑的情况下,开发者们必须从头开始完成收集数据、训练模型、调试模型、优化部署等一系列操作的问题;同时降低人工智能算法的开发成本,真正惠及细分行业,尤其是中小型企业。 上游(模型预训练)和下游 (模型微调)两个阶段:上游阶段主要收集大量数据,并且训练超大规模的神经网络,从而高效地存储和理解这些数据。下游阶段则在不同场景中,利用相对较少的数据量和计算量,对模型进行微调,以达成特定的目的。 图:预训练大模型的特征与优势 资料来源:华为《预训练大模型白皮书》,国信证券经济研究所整理 华为云团队于2020年立项AI大模型,并于2021年4月首次以“盘古预训练大模型”(简称“盘古大模型”)的名称对外发布。盘古大模型集成了华为云团队在AI领域数十项研究成果,并且受益于华为的全栈式AI解决方案,与昇腾(Ascend)芯片、昇思(MindSpore)语言、ModelArts平台深度结合。 盘古大模型:中国首个全栈自主的AI大模型 图:盘古大模型3.0架构图 2023年7月7日,在2023华为开发者大会上,面向行业的盘古大模型3.0发布,是中国首个全栈自主的AI大模型,包括“5+N+X”三层架构,分别对应L0层的5个基础大模型、L1层的N个行业通用大模型、以及L2层可以让用户自主训练的更多细化场景模型。其采用完全的分层解耦设计,企业用户可以基于自己的业务需要选择适合的大模型开发、升级或精调,从而适配千行百业多变的需求。 盘古大模型在商业落地走在前列: 盘古+工作流实现低算力、低门槛、边学边用的使用模式; 结合ModelArts和智能体工作流能力,实现轻量化交付; 借助华为已有行业基础,构筑行业大模型。 资料来源:华为云官网,国信证券经济研究所整理 二、L0基础大模型 盘古大模型3.0的L0层由5个基础大模型组成,包括盘古NLP(NaturalLanguageProcessing,自然语言处理)大模型、盘古CV(ComputerVision,计算机视觉)大模型、盘古多模态大模型、盘古预测大模型、盘古科学计算大模型等。 盘古大模型L0层赋予上百种能力,涵盖问答、生成、理解、代码、视觉、预测、科学计算、高阶等方面,覆盖广泛应用领域。盘古大模型3.0为客户提供100亿、380亿、710亿和1000亿参数的系列化基础大模型,能够匹配客户不同场景、不同时延、不同响应速度的行业多样化需求。 盘古基础大模型:提供满足行业场景需要的上百种能力 图:盘古大模型L0层赋予上百种能力 资料来源:华为云官网,国信证券经济研究所整理 图:盘古大模型3.0架构图 资料来源:华为云官网,国信证券经济研究所整理 盘古NLP大模型:业界首个超千亿参数的中文预训练大模型 盘古NLP大模型是业界首个超千亿参数的中文预训练大模型,利用大数据预训练、对多源丰富知识相结合,并通过持续学习吸收海量文本数据,不断提升模型的效果。在实现行业知识检索回答、文案生成、阅读理解等基础功能的同时,具备代码生成、插件调用、模型调用等高阶特性,在智能客服、创意营销、会议助手、代码助手、企业信息搜索等多个典型场景,提供AI技术支撑。 具备海量数据集、推理能力优、多任务促进、多模型调优、多插件补齐、全场景覆盖等优势。 海量数据集:通过对中文词汇、语法、语义等特征的深度分析,持续优化基础模型,打造业界最强中文理解/生成能力。 推理能力优:盘古NLP大模型采用文本+代码融合训练的方式,不仅需要从文本中提取信息,还需要理解代码的语义和逻辑及与文本之间的关系,提升思维链推理能力。 多任务促进:不同任务间具备强大的迁移能力,它所掌握的知识和技能可以轻松地转移到其他相关任务中,帮助模型更快地学习新任务,循环促进优化。 多模型调优:支持在不同领域任务中分别使用小模型进行特定领域的训练和优化,提高模型的使用效率和准确性,优质完成多领域任务。 多插件补齐:LLM成为连接应用生态的中枢,支持如知识图谱,搜索,符号引擎等,补足机制性缺陷,提高盘古NLP大模型整体性能。 全场景覆盖:支持行业知识问答,文案创作等多项能力,覆盖政务、金融、电商、能源等领域,低使用门槛助力多场景AI应用落地。 图:盘古NLP大模型功能介绍 智慧教育助手 行业内容生成 行业知识理解 智能协同办公 行业数据分析 1.单轮问答:历史、地理、科学、技术、 1.文案生成:根据行业需求完成营销文案、 1.开卷问答:针对标准发文内容进行 1、代码生成:根据用户描述或示例, 对行业结构化数据进行多维 文化等通用常识问答 公关稿件、公文、股 阅读理解和问答 自动生成相应代码 度分析,通过 2.多轮对话:根据用户提供的上下文信息进行逻辑推理和判断, 评等创作型任务2.要点生成:根据行业属性自动搜索和分 2.文本摘要:针对快讯、财经新闻、会议内容等生成简 2、代码修改:根据用户描述或示例,自动修改相应的代 数据清洗、数据转换、数据构建进行数理 自然流畅对话 析相关内容,生成要 明摘要 码,并对代码进行 逻辑推算,输 3.角色扮演:以职位、著名IP、客服等口吻回答用户问题 点3.表格生成:根据行业需求将字段以图表 3.信息抽取:针对时间、地点、人物等通用实体及工单 检查和优化3、代码理解:根据用户给定代码, 出结果,深度挖掘数据规律和背后趋势, 4.数学能力:具备基础的运算能力 的形式返回呈现 要素等信息抽取 输出代码的用途和实现方案 更好实现智能决策。 图:盘古NLP大模型应用场景 政企知识检索智能创意营销行业研发助