您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国金证券]:AI行业深度研究:阿里“通义千问”重磅发布,生态入口优势有望落地全域智能 - 发现报告
当前位置:首页/行业研究/报告详情/

AI行业深度研究:阿里“通义千问”重磅发布,生态入口优势有望落地全域智能

信息技术2023-04-12国金证券佛***
AI行业深度研究:阿里“通义千问”重磅发布,生态入口优势有望落地全域智能

4月11日上午,阿里AI大模型“通义千问”于2023阿里云峰会重磅发布。阿里巴巴集团CEO张勇表示,基础大模型的核心是能够支撑各行各业,阿里希望能够为客户与合作伙伴提供面向千行百业的专属大模型。阿里巴巴表示,所有产品未来都要接入大模型进行全面的升级,所有行业和所有服务都值得重新做一遍。 从M6项目到“通义千问”的发展之路。阿里AI大模型“通义千问”前身系阿里达摩院M6项目,阿里达摩院于2020年6月发布3亿参数基础模型,21年1月模型参数规模达百亿,同年5月达万亿参数,同年10月达10万亿,成为全球首个10万亿参数多模态大模型,并落地应用于天猫虚拟主播等40多个细分场景。22年9月达摩院发布“通义”大模型系列,打造业界首个AI底座,且兼顾大小模型的层次化建构体系。 C端应用:构造全域智能生态场景。我们认为,阿里入局AI大模型竞争的核心优势不仅在于算力算法层面的优越性与C端生活场景数据的丰富性,而且在于能够精准把控C端用户的生态入口。阿里大模型“通义千问”有望基于其升级版天猫精灵(智能居家入口)、淘宝(智能电商入口)、钉钉(智能办公入口)、高德地图 (智能汽车入口)等,协同合作厂商共建阿里系生态,借助多项生态入口打造覆盖“衣食住行工”的全域智能生态场景。目前,发布会已披露三大场景:智能居家:通义千问×智能家居(天猫精灵等),有望成为具备个性化故事生成、个性化歌单推荐、个性化菜谱生成等功能的智能生活助理。智能办公:通义千问×钉钉,有望实现AI智能生成群聊摘要、AI辅助内容创作、AI自动总结会议纪要、AI拍照生成应用等功能。智能购物:通义千问×淘宝,有望实现对话生成智能购物助手、智能品牌推荐、智能品类推荐、智能活动策划、文字生成图片、以图搜同款、个性化商品生产等功能。 B/G端应用:AGI落地千行百业,AIforX时代将至。阿里生态内A股产业链相关公司或将率先受益:恒生电子(通义千问×金融)、千方科技(通义千问×交通)、南威软件(通义千问×政务)、新开普(通义千问 ×教育)、光云科技(通义千问×电商)、安恒信息(通义千问×网安)、金桥信息(通义千问×法律)、税友股份(通义千问×税务)、超图软件(通义千问×设计)、卫宁健康(通义千问×医疗)。 C端智能家居场景推荐关注国内全屋智能头部厂商萤石网络,智能电商场景推荐关注阿里体系内电商SaaS服务商光云科技;B/G端应用推荐关注阿里生态行业IT标的恒生电子、千方科技、南威软件等(完整推荐组合详见正文投资建议)。 海外基础软硬件使用受限的风险;AI应用落地不及预期的风险;行业竞争加剧风险。 内容目录 1.阿里入局AI大模型,从M6到通义大模型的进阶之路4 1.1发展沿革:从M6到通义大模型,阿里大模型的迭代进阶之路4 1.1.1阿里大模型的迭代进阶之路4 1.1.2阿里达摩院年度科技趋势:阿里对AI大模型高度重视4 1.2通义大模型:统一技术底座,实现架构、模态、任务三位一体5 1.2.1基础框架:统一技术底座+通用模型层,赋能下游千行百业5 1.2.2统一技术底座-三位一体:M6-OFA为通义大模型底座,实现架构、模态、任务三方面统一6 1.2.3通用模型层-通义语言模型AliceMind7 1.2.4通用模型层-通义视觉大模型8 2.“阿里大模型+生态入口”有望打造全域智能场景8 2.1阿里大模型+天猫精灵+全屋智能=智能居家生态8 2.2阿里大模型+淘宝/天猫平台/光云科技=智能电商生态10 2.3阿里大模型+钉钉=智能办公生态12 2.4阿里大模型+高德地图+座舱智能=智能汽车生态14 3.“阿里大模型+下游生态链”有望助力千行百业智能化转型16 3.1阿里生态链一张图16 3.2阿里大模型+金融:恒生电子16 3.3阿里大模型+交通:千方科技17 3.4阿里大模型+政务:南威软件17 3.5阿里大模型+教育:新开普18 3.6阿里大模型+电商:光云科技18 3.7阿里大模型+网安:安恒信息19 3.8阿里大模型+法律:金桥信息19 3.9阿里大模型+税务:税友股份20 3.10阿里大模型+设计:超图软件20 3.11阿里大模型+医疗:卫宁健康21 4.投资建议22 5.风险提示22 图表目录 图表1:从M6到通义大模型进阶之路4 图表2:达摩院22、23年科技趋势体现对AI大模型的重视5 图表3:通义大模型架构基础框架6 图表4:M6-OFA实现模态统一7 图表5:通义语言模型AliceMind在CLUE上首次超越人类成绩7 图表6:通义视觉大模型介绍8 图表7:阿里“鸟鸟分鸟”大模型的训练步骤9 图表8:阿里“鸟鸟分鸟”大模型的听音训练模式9 图表9:真格基金7项针对大模型的测试题与答复9 图表10:通义千问赋能天猫精灵有望打通智能居家生态,实现居家�大场景智能化落地10 图表11:阿里大模型有望赋能阿里系电商品牌交汇融合11 图表12:智能电商全流程�大革新趋势12 图表13:阿里大模型赋能钉钉实现四大智能办公场景13 图表14:阿里大模型有望借助钉钉入口,一体化赋能智能办公生态14 图表15:高德打通智能座舱生态场景入口,为用户提供最合适的一站式出行方案14 图表16:智能座舱内的“超级娱乐空间”15 图表17:阿里大模型赋能智能驾驶15 图表18:智能驾驶融合式多模交互概念展示15 图表19:阿里大模型有望赋能下游生态千行百业16 图表20:恒生电子:国内领先的金融软件与网络服务供应商17 图表21:千方科技:国内智慧交通与车联网行业龙头17 图表22:南威软件:国内领先的数字政府服务与运营商18 图表23:新开普:校园一卡通业务龙头18 图表24:光云科技:国内领先的电商软件服务提供商19 图表25:安恒信息:国内首次网安工程三级资质单位19 图表26:金桥信息:智慧法治系统领导者20 图表27:税友股份:国内领先的财税信息化综合服务商20 图表28:超图软件:国内领先的地理信息系统平台商21 图表29:卫宁健康:国内医疗卫生信息化龙头21 图表30:推荐关注阿里生态链相关标的22 1.1发展沿革:从M6到通义大模型,阿里大模型的迭代进阶之路 1.1.1阿里大模型的迭代进阶之路 项目启动阶段:M6项目于2020年启动,同年6月推出3亿参数的基础模型,2021年1月,模型参数规模达百亿,成为世界最大的中文多模态模型。 万亿模型阶段:2021年5月,达摩院发布万亿参数模型M6并正式投入使用,追上谷歌发展脚步。M6在多模态GreenAI、文到图生成、商业化领域并肩世界一流水平,与英伟达、谷歌相比,M6仅用480卡V10032GGPU就实现了万亿模型,节省算力资源超80%,训练效率提升近11倍。 十万亿模型阶段:2021年10月,M6进一步升级成为全球首个10万亿参数的多模态大模型,并应用于天猫虚拟主播等40多个创造相关场景中;在绿色低碳方面,相比GPT-3,M6实现了同等参数规模下,能耗仅为1%。 大模型阶段:2022年9月,达摩院发布“通义”大模型系列,打造业界首个AI统一底座,并构建了大小模型协同的层次化人工智能体系,其中,统一底座M6-OFA模型在不引入新增结构情况下,可同时处理10余项单模态和跨模态任务,通义大模型的出现将为AI从感知智能迈向知识驱动的认知智能提供先进基础设施。 图表1:从M6到通义大模型进阶之路 来源:机器之心微信公众平台,国金证券研究所 1.1.2阿里达摩院年度科技趋势:阿里对AI大模型高度重视 达摩院每年都会发布对当年的十大科技趋势预测,在最近两年的科技趋势预测中,充分体现阿里对AI技术及大模型的重视: 2022年,达摩院在十大科技趋势中提到多项AI相关内容,包括AIforScience(将AI应用于高技术领域科学研究)、大小模型协同进化、绿色能源AI(基于AI算力对资源消耗严重的现实,从降本增效角度提出了绿色能源AI新概念)等。 2023年,达摩院在十大科技趋势中,将多模态预训练大模型放在首位,足以显现其对大模型的重视。CLIP和BEiT-3等多模态模型实现技术突破,多模态融合的通用人工智能成为未来发展趋势。多模态预训练的发展将重塑人工智能商业模式。多模态统一建模,目的是增强模型的跨模态语义对齐能力,打通各模态之间的关系,促使模型逐步标准化。基于多领域知识,构建统一的、跨场景、多任务的多模态基础模型将成为未来人工智能的重点发展方向。 图表2:达摩院22、23年科技趋势体现对AI大模型的重视 来源:达摩院微信公众平台,国金证券研究所 1.2通义大模型:统一技术底座,实现架构、模态、任务三位一体 1.2.1基础框架:统一技术底座+通用模型层,赋能下游千行百业 统一技术底座主要由M6-OFA模型和模块化设计两部分构成。1)M6-OFA模型,可在不引入任何新增结构的情况下,同时处理图像描述、视觉定位、文生图、视觉蕴含、文档摘要等10余项单模态和跨模态任务,并达到国际领先水平,完成升级后可处理超过30种跨模态任务。2)模块化设计,借鉴了人脑模块化设计,以场景为导向灵活拆拔功能模块,实现高效率和高性能。 通用模型层主要包含通义-M6、通义-AliceMind、通义-视觉三种通用模型。1)通义 -M6是国际首个参数规模达到10万亿的全球最大预训练模型。2)通义-AliceMind作为开源深度语言模型体系,形成了从文本PLUG到多模态mPLUG再到模块化统一模型演化趋势。3)通义-视觉可在电商行业实现图像搜索和万物识别等场景应用,并在文生图以及交通和自动驾驶领域发挥作用。 图表3:通义大模型架构基础框架 来源:机器之心微信公众平台,国金证券研究所 1.2.2统一技术底座-三位一体:M6-OFA为通义大模型底座,实现架构、模态、任务三方面统一 通义大模型在国内率先构建AI统一底座,在业界首次实现模态表示、任务表示、模型结构的统一,统一学习范式OFA是通义大模型背后的核心技术支撑。 架构统一:M6-OFA采用了TransformerEncoder-Decoder+ResNetBlocks架构,ResNetBlocks用于提取图像特征,TransformerEncoder负责多模态特征的交互,TransformerDecoder采用自回归方式输出结果。无需增加任何任务特定的模型层,即可实现预训练与微调的相同学习模式。 模态统一:M6-OFA构建了一个涵盖不同模态的通用词表,以便模型使用该词表表示不同任务的输出结果。其中BPE编码的自然语言token用于表示文本类任务或图文类任务的数据;图片中连续的横纵坐标编码为离散化token,用于表示视觉定位、物体检测的数据;图片中的像素点信息编码为离散化token,用于表示图片生成、图片补全等任务的数据。 任务统一:通过设计不同的instruction,M6-OFA将涉及多模态和单模态(即NLP和CV)的所有任务都统一建模成序列到序列(seq2seq)任务。M6-OFA覆盖了5项多模态任务,视觉定位、定位字幕、图文匹配、图像字幕和视觉问答;2项视觉任务,检测和图像填补和1项文本任务,即文本填补。 图表4:M6-OFA实现模态统一 来源:机器之心微信公众平台,国金证券研究所 1.2.3通用模型层-通义语言模型AliceMind 作为阿里达摩院的开源深度语言模型体系,通义-AliceMind包含了通用语言模型StructBERT、生成式PALM、结构化StructuralLM、超大中文PLUG、多模态StructVBERT、多语言VECO、对话SPACE1.0/2.0/3.0和表格STAR1.0/2.0,过程中形成了从文本PLUG到多模态mPLUG再到模块化统一模型演化趋势。 AliceMind在中文语言理解水平达到新的高度。2021年8月,AliceMind在VQA上以81.26%的准确率创造全球记录,首次超过人类基准线80.83%。在中文语言理解测评基础CLUE上,通义AliceMind于202