对等关税新质生产力低空经济 DeepSeek AIGC 人形机器人智能驾驶大模型固态电池半导体

AI行业深度研究：阿里“通义千问”重磅发布，生态入口优势有望落地全域智能

信息技术2023-04-11国金证券佛***

AI智能总结

阿里巴巴AI大模型“通义千问”发布及应用展望

一、通义千问发布背景与意义

发布时间与地点：2023年4月11日，于阿里云峰会上，阿里巴巴集团CEO张勇宣布了AI大模型“通义千问”的发布。
目标与愿景：旨在通过AI大模型赋能各行各业，提供面向千行百业的专属解决方案，推动所有产品和服务的全面升级。

二、从M6项目到通义大模型的进阶之路

M6项目：始于2020年，逐步扩展模型参数规模，从3亿参数到最终成为全球首个10万亿参数的多模态大模型，涵盖多个应用场景。
通义大模型：集成了M6-OFA作为统一技术底座，实现架构、模态、任务三方面的统一，构建了业界首个AI底座，支持不同规模模型的协同工作。

三、“阿里大模型+生态入口”打造全域智能场景

智能居家：通义千问与天猫精灵等智能家居设备集成，提供个性化服务如故事生成、歌单推荐、菜谱生成等。
智能办公：通义千问与钉钉结合，实现群聊摘要、内容创作辅助、会议纪要总结、拍照应用等功能。
智能购物：在淘宝/天猫平台应用，提供智能购物助手、品牌推荐、品类推荐、活动策划、图片生成等服务。

四、赋能千行百业的智能化转型

金融：与恒生电子合作，探索AI在金融领域的应用。
交通：与千方科技合作，推动智能交通系统的建设。
政务：与南威软件合作，优化政府服务流程。
教育：与新开普合作，提升教育信息化水平。
电商：与光云科技合作，增强电商平台的智能化。
网络安全：与安恒信息合作，提升网络安全防护能力。
法律：与金桥信息合作，优化法律服务。
税务：与税友股份合作，提高税务服务效率。
设计：与超图软件合作，促进设计行业的数字化转型。
医疗：与卫宁健康合作，推动医疗卫生信息化。

五、投资建议与风险提示

投资组合：推荐关注阿里生态链内的相关上市公司，如恒生电子、千方科技、南威软件等。
风险考量：关注海外基础软硬件使用限制、AI应用落地速度、行业竞争加剧等风险。

以上总结基于提供的文字内容，详细阐述了阿里巴巴AI大模型“通义千问”的发布背景、技术创新、应用场景以及对行业的影响，并提供了相应的投资建议与风险提示。

4月11日上午，阿里AI大模型“通义千问”于2023阿里云峰会重磅发布。阿里巴巴集团CEO张勇表示，基础大模型的核心是能够支撑各行各业，阿里希望能够为客户与合作伙伴提供面向千行百业的专属大模型。阿里巴巴表示，所有产品未来都要接入大模型进行全面的升级，所有行业和所有服务都值得重新做一遍。 从M6项目到“通义千问”的发展之路。阿里AI大模型“通义千问”前身系阿里达摩院M6项目，阿里达摩院于2020年6月发布3亿参数基础模型，21年1月模型参数规模达百亿，同年5月达万亿参数，同年10月达10万亿，成为全球首个10万亿参数多模态大模型，并落地应用于天猫虚拟主播等40多个细分场景。22年9月达摩院发布“通义”大模型系列，打造业界首个AI底座，且兼顾大小模型的层次化建构体系。 C端应用：构造全域智能生态场景。我们认为，阿里入局AI大模型竞争的核心优势不仅在于算力算法层面的优越性与C端生活场景数据的丰富性，而且在于能够精准把控C端用户的生态入口。阿里大模型“通义千问”有望基于其升级版天猫精灵（智能居家入口）、淘宝（智能电商入口）、钉钉（智能办公入口）、高德地图（智能汽车入口）等，协同合作厂商共建阿里系生态，借助多项生态入口打造覆盖“衣食住行工”的全域智能生态场景。目前，发布会已披露三大场景：智能居家：通义千问×智能家居（天猫精灵等），有望成为具备个性化故事生成、个性化歌单推荐、个性化菜谱生成等功能的智能生活助理。智能办公：通义千问×钉钉，有望实现AI智能生成群聊摘要、AI辅助内容创作、AI自动总结会议纪要、AI拍照生成应用等功能。智能购物：通义千问×淘宝，有望实现对话生成智能购物助手、智能品牌推荐、智能品类推荐、智能活动策划、文字生成图片、以图搜同款、个性化商品生产等功能。 B/G端应用：AGI落地千行百业，AIforX时代将至。阿里生态内A股产业链相关公司或将率先受益：恒生电子（通义千问×金融）、千方科技（通义千问×交通）、南威软件（通义千问×政务）、新开普（通义千问 ×教育）、光云科技（通义千问×电商）、安恒信息（通义千问×网安）、金桥信息（通义千问×法律）、税友股份（通义千问×税务）、超图软件（通义千问×设计）、卫宁健康（通义千问×医疗）。 C端智能家居场景推荐关注国内全屋智能头部厂商萤石网络，智能电商场景推荐关注阿里体系内电商SaaS服务商光云科技；B/G端应用推荐关注阿里生态行业IT标的恒生电子、千方科技、南威软件等（完整推荐组合详见正文投资建议）。 海外基础软硬件使用受限的风险；AI应用落地不及预期的风险；行业竞争加剧风险。内容目录 1.阿里入局AI大模型，从M6到通义大模型的进阶之路4 1.1发展沿革：从M6到通义大模型，阿里大模型的迭代进阶之路4 1.1.1阿里大模型的迭代进阶之路4 1.1.2阿里达摩院年度科技趋势：阿里对AI大模型高度重视4 1.2通义大模型：统一技术底座，实现架构、模态、任务三位一体5 1.2.1基础框架：统一技术底座+通用模型层，赋能下游千行百业5 1.2.2统一技术底座-三位一体：M6-OFA为通义大模型底座，实现架构、模态、任务三方面统一6 1.2.3通用模型层-通义语言模型AliceMind7 1.2.4通用模型层-通义视觉大模型8 2.“阿里大模型+生态入口”有望打造全域智能场景8 2.1阿里大模型+天猫精灵+全屋智能=智能居家生态8 2.2阿里大模型+淘宝/天猫平台/光云科技=智能电商生态10 2.3阿里大模型+钉钉=智能办公生态12 2.4阿里大模型+高德地图+座舱智能=智能汽车生态14 3.“阿里大模型+下游生态链”有望助力千行百业智能化转型16 3.1阿里生态链一张图16 3.2阿里大模型+金融：恒生电子16 3.3阿里大模型+交通：千方科技17 3.4阿里大模型+政务：南威软件17 3.5阿里大模型+教育：新开普18 3.6阿里大模型+电商：光云科技18 3.7阿里大模型+网安：安恒信息19 3.8阿里大模型+法律：金桥信息19 3.9阿里大模型+税务：税友股份20 3.10阿里大模型+设计：超图软件20 3.11阿里大模型+医疗：卫宁健康21 4.投资建议22 5.风险提示22 图表目录图表1：从M6到通义大模型进阶之路4 图表2：达摩院22、23年科技趋势体现对AI大模型的重视5 图表3：通义大模型架构基础框架6 图表4：M6-OFA实现模态统一7 图表5：通义语言模型AliceMind在CLUE上首次超越人类成绩7 图表6：通义视觉大模型介绍8 图表7：阿里“鸟鸟分鸟”大模型的训练步骤9 图表8：阿里“鸟鸟分鸟”大模型的听音训练模式9 图表9：真格基金7项针对大模型的测试题与答复9 图表10：通义千问赋能天猫精灵有望打通智能居家生态，实现居家�大场景智能化落地10 图表11：阿里大模型有望赋能阿里系电商品牌交汇融合11 图表12：智能电商全流程�大革新趋势12 图表13：阿里大模型赋能钉钉实现四大智能办公场景13 图表14：阿里大模型有望借助钉钉入口，一体化赋能智能办公生态14 图表15：高德打通智能座舱生态场景入口，为用户提供最合适的一站式出行方案14 图表16：智能座舱内的“超级娱乐空间”15 图表17：阿里大模型赋能智能驾驶15 图表18：智能驾驶融合式多模交互概念展示15 图表19：阿里大模型有望赋能下游生态千行百业16 图表20：恒生电子：国内领先的金融软件与网络服务供应商17 图表21：千方科技：国内智慧交通与车联网行业龙头17 图表22：南威软件：国内领先的数字政府服务与运营商18 图表23：新开普：校园一卡通业务龙头18 图表24：光云科技：国内领先的电商软件服务提供商19 图表25：安恒信息：国内首次网安工程三级资质单位19 图表26：金桥信息：智慧法治系统领导者20 图表27：税友股份：国内领先的财税信息化综合服务商20 图表28：超图软件：国内领先的地理信息系统平台商21 图表29：卫宁健康：国内医疗卫生信息化龙头21 图表30：推荐关注阿里生态链相关标的22 1.1发展沿革：从M6到通义大模型，阿里大模型的迭代进阶之路 1.1.1阿里大模型的迭代进阶之路 项目启动阶段：M6项目于2020年启动，同年6月推出3亿参数的基础模型，2021年1月，模型参数规模达百亿，成为世界最大的中文多模态模型。 万亿模型阶段：2021年5月，达摩院发布万亿参数模型M6并正式投入使用，追上谷歌发展脚步。M6在多模态GreenAI、文到图生成、商业化领域并肩世界一流水平，与英伟达、谷歌相比，M6仅用480卡V10032GGPU就实现了万亿模型，节省算力资源超80%，训练效率提升近11倍。 十万亿模型阶段：2021年10月，M6进一步升级成为全球首个10万亿参数的多模态大模型，并应用于天猫虚拟主播等40多个创造相关场景中；在绿色低碳方面，相比GPT-3，M6实现了同等参数规模下，能耗仅为1%。 大模型阶段：2022年9月，达摩院发布“通义”大模型系列，打造业界首个AI统一底座，并构建了大小模型协同的层次化人工智能体系，其中，统一底座M6-OFA模型在不引入新增结构情况下，可同时处理10余项单模态和跨模态任务，通义大模型的出现将为AI从感知智能迈向知识驱动的认知智能提供先进基础设施。图表1：从M6到通义大模型进阶之路来源：机器之心微信公众平台，国金证券研究所 1.1.2阿里达摩院年度科技趋势：阿里对AI大模型高度重视达摩院每年都会发布对当年的十大科技趋势预测，在最近两年的科技趋势预测中，充分体现阿里对AI技术及大模型的重视： 2022年，达摩院在十大科技趋势中提到多项AI相关内容，包括AIforScience（将AI应用于高技术领域科学研究）、大小模型协同进化、绿色能源AI（基于AI算力对资源消耗严重的现实，从降本增效角度提出了绿色能源AI新概念）等。 2023年，达摩院在十大科技趋势中，将多模态预训练大模型放在首位，足以显现其对大模型的重视。CLIP和BEiT-3等多模态模型实现技术突破，多模态融合的通用人工智能成为未来发展趋势。多模态预训练的发展将重塑人工智能商业模式。多模态统一建模，目的是增强模型的跨模态语义对齐能力，打通各模态之间的关系，促使模型逐步标准化。基于多领域知识，构建统一的、跨场景、多任务的多模态基础模型将成为未来人工智能的重点发展方向。图表2：达摩院22、23年科技趋势体现对AI大模型的重视来源：达摩院微信公众平台，国金证券研究所 1.2通义大模型：统一技术底座，实现架构、模态、任务三位一体 1.2.1基础框架：统一技术底座+通用模型层，赋能下游千行百业 统一技术底座主要由M6-OFA模型和模块化设计两部分构成。1）M6-OFA模型，可在不引入任何新增结构的情况下，同时处理图像描述、视觉定位、文生图、视觉蕴含、文档摘要等10余项单模态和跨模态任务，并达到国际领先水平，完成升级后可处理超过30种跨模态任务。2）模块化设计，借鉴了人脑模块化设计，以场景为导向灵活拆拔功能模块，实现高效率和高性能。 通用模型层主要包含通义-M6、通义-AliceMind、通义-视觉三种通用模型。1）通义 -M6是国际首个参数规模达到10万亿的全球最大预训练模型。2）通义-AliceMind作为开源深度语言模型体系，形成了从文本PLUG到多模态mPLUG再到模块化统一模型演化趋势。3）通义-视觉可在电商行业实现图像搜索和万物识别等场景应用，并在文生图以及交通和自动驾驶领域发挥作用。图表3：通义大模型架构基础框架来源：机器之心微信公众平台，国金证券研究所 1.2.2统一技术底座-三位一体：M6-OFA为通义大模型底座，实现架构、模态、任务三方面统一通义大模型在国内率先构建AI统一底座，在业界首次实现模态表示、任务表示、模型结构的统一，统一学习范式OFA是通义大模型背后的核心技术支撑。 架构统一：M6-OFA采用了TransformerEncoder-Decoder+ResNetBlocks架构，ResNetBlocks用于提取图像特征，TransformerEncoder负责多模态特征的交互，TransformerDecoder采用自回归方式输出结果。无需增加任何任务特定的模型层，即可实现预训练与微调的相同学习模式。 模态统一：M6-OFA构建了一个涵盖不同模态的通用词表，以便模型使用该词表表示不同任务的输出结果。其中BPE编码的自然语言token用于表示文本类任务或图文类任务的数据；图片中连续的横纵坐标编码为离散化token，用于表示视觉定位、物体检测的数据；图片中的像素点信息编码为离散化token，用于表示图片生成、图片补全等任务的数据。 任务统一：通过设计不同的instruction，M6-OFA将涉及多模态和单模态（即NLP和CV）的所有任务都统一建模成序列到序列（seq2seq）任务。M6-OFA覆盖了5项多模态任务，视觉定位、定位字幕、图文匹配、图像字幕和视觉问答；2项视觉任务，检测和图像填补和1项文本任务，即文本填补。图表4：M6-OFA实现模态统一来源：机器之心微信公众平台，国金证券研究所 1.2.3通用模型层-通义语言模型AliceMind 作为阿里达摩院的开源深度语言模型体系，通义-AliceMind包含了通用语言模型StructBERT、生成式PALM、结构化StructuralLM、超大中文PLUG、多模态StructVBERT、多语言VECO、对话SPACE1.0/2.0/3.0和表格STAR1.0/2.0，过程中形成了从文本PLUG到多模态mPLUG再到模块化统一模型演化趋势。 AliceMind在中文语言理解水平达到新的高度。2021年8月，AliceMind在VQA上以81.26%的准确率创造全球记录，首次超过人类基准线80.83%。在中文语言理解测评基础CLUE上，通义AliceMind于202

点击免费查看完整报告