【民生计算机】华为大模型:最接近人类中文理解能力的AI大模型 事件:3月23日举行的华为春季旗舰新品发布会上华为带来全新智慧搜图功能,基于多模态大模型技术,在手机端侧对模型进行小型化处理,在业界率先实现了首创的、精准的自然语言手机图库搜索体验。 点评: 华为具备卓越的大模型技术,早在2021年发布的华为云盘古NLP大模型是业界首个2000亿参数中文预训练模型。 2021年4月25日华为云发布盘古系列超大规模预训练模型,包括在当时30亿参数的全球最大视觉(CV)预训练模型,以及与循环智能、鹏城实验室联合开发的千亿参数、40TB训练数据的全球最大中文语言(NLP)预训练模型。 与其他大模型不同的是,盘古NLP大模型瞄准的是细分行业,主要解决商业环境中低成本大规模定制的问题。 盘古NLP大模型首次使用Encoder-Decoder架构兼顾NLP大模型的理解能力和生成能力,保证了模型在不同系统中的嵌入灵活性。下游应用中,仅需少量样本和可学习参数即可完成千亿规模大模型的快速微调和下游适配。 2019年权威的中文语言理解评测基准CLUE榜单中,盘古NLP大模型在总排行榜及分类、阅读理解单项均排名第一,刷新三项榜单世界历史纪录;总排行榜得分83.046,多项子任务得分业界领先,是目前最接近人类理解水平(85.61)的预训练模型。 将通用知识与行业经验相结合,在生成与理解性能上处于领先地位。 盘古NLP大模型采用了大模型小样本的调优方式,基于提示(prompt-based)的调优、动态冰化等一系列正则化技术,实现了小样本学习任务上超越GPT系列。 盘古NLP大模型在预训练阶段加入了基于prompt的任务,大幅降低了微调难度,解决了以往大模型面对复杂的商用场景的难以进行的少样本学习问题。 盘古NLP大模型还可以通过少样本学习对意图进行识别,转化为知识库和数据库查询,解决以往大模型难融入行业知识和数据的问题。盘古NLP大模型可以赋能千行百业,应用于各种场景。 在智能营销领域,盘古NLP大模型可以通过文本匹配,问答和对话系统、意图识别等关键技术更好地赋能销售环节,取代目前逐渐上升的人力成本和低成功率的智能客服与营销系统,帮助服务人员快速提升业务水平,重塑消费者体验。 在智能舆情方面,盘古NLP大模型可以利用文档信息抽取、情感分类、文档自动摘要等技术在金融,电商,政务领域实现精准舆情分析、企业运营软件分析。 投资建议:AI浪潮下,华为的AI能力有望持续通过技术创新,驱动产业智能升级。 华为产业链相关公司有望充分受益:1)硬件层面:建议重点关注拓维信息、神州数码、常山北明等;2)软件层面:建议重点关注赛意信息、中科创达、法本信息、软通动力等。 风险提示:AI技术成熟节奏低于预期,行业竞争加剧。