扫码关注浦银国际研究 相关报告: 互联网行业2023年中期展望:AIGC,能否拯救互联网的“中年危机”?(2023-06-26) 序幕揭开:ChatGPT将AIGC推向“平民化”时代(2023-02-14) 2023年7月10日 赵丹 互联网分析师dan_zhao@spdbi.com(852)28086436 杨子超 互联网助理分析师charles_yang@spdbi.com(852)28086409 浦银国际 AIGC行业趋势:大模型趋于分化,关注应用场景落地 行业追踪 近期,我们参加了数场关于人工智能的行业交流会,包括全球数字经济大会、世界人工智能大会等。与往年相比,今年的热门话题主要围绕AIGC(生成式人工智能)展开,其中行业趋势包括:1)大模型趋于分化,行业模型或成为普及关键;2)具身智能和多模态智能或成为下一个重点投资方向;3)应用场景落地是关键,ToB才是主战场。 “百模大战”后期或趋于分化。2023年被称为AIGC元年,大模型也成为重中之重,市场预期其创新性甚至远大于移动互联网。AIGC或进一步解放生产力,帮助企业降本增效,影响并改变着互联网的获取信息和内容产出方式。虽然近期行业龙头ChatGPT用户数增速放缓,但是业内对此并不担忧,因为这并不代表技术迭代变慢。 AIGC行业趋势 据不完全统计,国内已经有近百家大模型,包括通用和垂直、开源和闭源等不同类型。此外,在2023年的世界人工智能大会上,360集团、百度、华为、阿里巴巴等企业被工信部中国电子技术标准化研究院授予“国家人工智能标准化总体组大模型专题组”组长单位,积极推动大模型国家标准体系建设,助力中国大模型产业发展。 行业大模型或成为衍变趋势。未来大模型会进一步分化为通用、专用和特定场景。市场普遍认为,从行业特征来看,通用大模型未来只可能是少数巨头最后胜出,主要考虑巨大的资金投入,基础大模型并不适用于数量众多的中小企业。通用大模型并不能解决很多企业的具体问题,而模型的大小,主要还是取决于企业用户的自身需求,企业的大模型应用需要综合考虑行业专业性、数据安全、持续迭代和综合成本等因素。 垂直行业的模型未来或成为大模型加速普及的关键,通用公域数据叠加行业数据,共同构成了产业大模型的训练数据来源。行业大模型的未来趋势特点还包括:场景集成化,AI原生化以及部署工业化等方面。 本研究报告由浦银国际证券有限公司分析师编制,请仔细阅读本报告最后部分的分析师披露、商业关系披露及免责声明。 MaaS或进一步推动AI普惠化。MaaS(模型即服务)的理念,提出了以人工智能模型为核心的开发范式,搭建云计算技术和服务架构,以此向大模型初创企业和开发者开放。MaaS允许开发人员将机器学习模型部署到应用程序中,并提供自动化方式来进行模型训练、推理、部署、精调、测评、产品化落地等在内的全方位服务。MaaS的出现或进一步降低使用门槛,提升大模型普及率。 中美大模型差异:国内企业在底层模型仍需提高,优势在于应用生态。业内普遍认为,中美大模型目前仍存在一定距离,不过国内公司正在迎头赶上。一方面,大模型一定要有充足的算力作为基础;另一方面,在数据层面,中文语料的复杂性及质量参差,也对国内大模型研发带来了挑战,后期高质量的数据才是大模型不断优化的关键。 此外,腾讯也发布大模型时代的AI十大趋势: 一是涌现,LLM推动人工智能快速进化到AGI阶段;二是融合,多模态助力大模型解决复杂问题; 三是懂你,大模型带来更贴近人的交互方式;四是生态,模型即服务(MaaS)生态呼之欲出;五是泛在,垂直领域应用是大模型的主战场; 六是平台,Plugin工具让大模型迎来APPStore时刻;七是入口,大模型为数字人“注入灵魂”; 八是赋能,AI大模型助力个体成为超级生产者; 九是冲击,版权“思想表达二分法”基石正在动摇;十是向善,伦理和安全建设塑造负责任的AI生态。 具身智能也是市场重点关注的投资方向之一。英伟达CEO黄仁勋也曾提出,人工智能的下一个浪潮将是具身智能。具身智能是指拥有身体并支持物理交互的智能体,具备感知、思考、学习、决策等能力,能够与环境进行交互。具身智能有望成为人工智能的最终载体,主要代表产品包括机器人和自动驾驶汽车等。当前具身智能产业链中包括数字基础设施、机器人制造、机器视觉、多模态大模型的厂商等相关环节。 多模态智能是具身智能的必经之路。除了在计算机视觉、自然语言处理等特定领域模型的发展,多模态大模型的进一步交叉融合或将成为未来重要的应用方向。未来人与机器之间的交互方式将更加丰富,或通过文字、视觉、语音等多维度沟通,进而提升效率。 未来更加关注应用场景落地。能否应用落地并且具备商业化能力,才是检验大模型成功与否的标准。不同于传统C端消费互联网,B端产业互联网才是大模型的主战场。随着模型不断细分至垂直行业乃至特定场景,或推动应用落地加速。此外,大模型进行大规模推广落地所需具备的条件仍需改善:标准化、可靠化、大批量部署以及价格相对低廉。我们以可靠化为例,即用户对大模型安全性的担忧,当前生成式大模型以概率的方式生成内容,有时会一本正经“胡说八道”,被称为“AI幻觉”,而高质量的语料库是提升产出内容安全可靠性的关键。 投资风险:研发进展不及预期;商业化模式待验证。 图表1:中国AIGC相关标的 公司名称股票代码简介 百度BIDUUS 科大讯飞002230CH 昆仑万维300418CH 视觉中国000681CH 蓝色光标300058CH 商汤科技0020HK 云从科技688327CH 提供完整AI堆栈,包括由AI芯片、深度学习框架、核心AI功能如自然语言处理、知识图谱、语音识别、计算机视觉和增强现实,以及一个开放的人工智能平台。 从事智能语音、自然语言理解、计算机视觉等核心技术研究,在语音识别、语音合成、机器翻译、图文识别、图像理解、阅读理解、机器推理等领域具备优势。 发布了“昆仑天工”AIGC全系列算法与模型,旗下模型包括天工巧绘SkyPaint、天工乐府SkyMusic、天工妙笔SkyText、天工智码SkyCode,覆盖图像、音乐、文本、编程等多模态内容生成能力,成为目前国内AIGC领域布局最为全面的公司之一。 以“视觉内容”为核心,提供优质版权素材及智能服务。相关AI生成内容的业务是依托公司既有的海量数据和商业应用场景,以及AI技术的相关积累,通过大数据分析学习,由公司旗下社区的摄影师、设计师和AI协同完成。 主营业务包括全案推广服务、全案广告代理以及元宇宙营销(虚拟人、虚拟物品以及虚拟空间),AI化是公司技术主线之一。 涵盖感知智能、决策智能、智能内容生成和智能内容增强等关键技术领域,同时包含AI芯片、AI传感器及AI算力基础设施在内的关键能力。 致力于助推人工智能产业化进程和各行业智慧化转型升级,提供信息化、数字化和智能化的人工智能服务,赋能智慧金融、智慧治理、智慧出行、智慧商业等应用场景,提供以人工智能技术为核心的行业解决方案。 海天瑞声688787CH全球AI训练数据服务商,持续推动智能语音、计算机视觉、自然语言理解等领域的创新与变革。 凌云光688400CH 寒武纪688256CH 小冰公司未上市 倒映有声未上市影谱科技 未上市 灵动音科技未上市 灵伴智能未上市 澜舟科技未上市 (接下页…) 聚焦机器视觉业务,提供可配置视觉系统、智能视觉装备与核心视觉器件等高端产品与解决方案,赋能电子制造、新型显示、印刷包装、新能源、影视动漫、科学图像、轨道交通等行业的智能“制造”。 专注于人工智能芯片产品的研发与技术创新,提供云边端一体、软硬件协同、训练推理融合、具备统一生态的系列化智能芯片产品和平台化基础系统软件。 小冰框架以自然语言处理(NLP)为基础,目前是全球承载交互量最大的完备人工智能框架之一,技术覆盖自然语言处理、计算机语音、计算机视觉及人工智能内容生成。在开放域对话、多模态交互、超级自然语音及内容生成领域居于全球领先。 通过自研神经渲染技术、数字孪生技术、以及独创的TTSA技术,从语义到声音图片,再到连续帧视频画面,实现多姿态的数字分身IP生成,并实现基于文本实时生成高质量语音(音频)和动画(视频),最终实现无人驱动数字分身。 专注于视觉内容的生产效率与呈现交互方式的技术研究,面向媒体、文化、科教等多行业领域提供一站式的智能解决方案。 致力于人工智能音乐,运用AI技术从作词、作曲、编曲、演唱、混音等方面全方位降低音乐创作及制作门槛,为音乐行业提供新的产品体验,提升效率。 专注人工智能领域基础技术研发、智能人机交互服务底层AI技术研发和智能技术的产业升级,核心技术覆盖机器感知智能到认知智能,具体包括语音抗噪、语音识别、语音合成、自然语言理解等。 以自然语言处理(NLP)技术为基础,为全球企业提供新一代认知智能平台,助力企业数字化转型升级。其主要产品是基于“孟子轻量化预训练模型”打造的一系列SaaS功能引擎(包括搜索、生成、翻译、对话等)和垂直场景应用。 (接上页…) 公司名称股票代码简介 rctAI未上市 云知声未上市 思必驰未上市 超参数科技未上市 秘塔科技未上市 香侬科技未上市 标贝科技未上市 帝视科技未上市 计算美学未上市 运用人工智能为游戏行业提供完整的解决方案,并利用人工智能生成内容创造真正的Metaverse。通过使用最前沿的技术,特别是深度学习和强化学习,rctAI为消费者和制作方提供真正动态且智能的用户体验。 国内头部人工智能独角兽企业。以人工智能语音技术为核心,通过全栈式技术链条,为企业和用户提供智能语音技术和综合解决方案。 国内专业的对话式人工智能平台公司,拥有全链路的智能语音语言技术,自主研发了新一代人机交互平台(DUI),和人工智能芯片(TH1520);为车联网、IoT及政务、金融等众多行业场景合作伙伴提供自然语言交互解决方案。 超参数科技是一家专注于AI领域的科技公司,致力于「打造有生命的AI」,创造一个10亿人与100亿AI共同生活的虚拟世界。 致力于将重复脑力劳动AI化,以AI为杠杆撬动专业场景的百倍生产力提升,在AIGC、文档辅助创作、智能合同等方向上开展研发与产品落地。 为机构提供非结构化数据处理的人工智能解决方案。以前沿的自然语言处理(NLP)技术为利器,化繁为简,清晰呈现最有价值信息,推动金融资产管理、风控评级、行业研究、投资决策等业务的持续扩张和服务升级。 专注于智能语音交互和AI数据服务,基于AI+SaaS开放平台,为客户提供AI数据服务、技术能力、智能语音交互方案赋能服务,包括通用场景的语音合成和语音识别,以及TTS音色定制,声音复刻,情感合成和声音转换在内的语音技术产品;AI数据业务涵盖语音合成、语音识别、图像视觉、NLP等采标服务和平台化自研工具能力。 致力于人工智能和计算机视觉前沿技术研究与行业应用产品开发,业务聚焦智能制造及数智影像两大领域。 聚焦于人工智能和设计创意交叉领域,旗下AIGC产品“画宇宙”定位是面向创作者的超级生产力工具,旗下智能设计产品“图宇宙”主打高品质的智能设计引擎。 追一科技未上市主攻深度学习和自然语言处理,提供智能语义,语音和视觉的AI全栈服务。 中科闻歌未上市 相芯科技未上市 筷子科技未上市 来画未上市 数据智能服务商,聚焦互联网多语言,跨模态,文本、图片、网页、视频等机器学习和智能计算核心技术研发,面向泛媒体、泛政务、泛金融和泛安全领域,提供多语言、跨模态和深度认知智能的大数据系统、服务与解决方案。 专注于计算机图形学和人工智能技术的深度融合,推动XR技术创新和产业应用,自主研发的“虚拟数字人引擎”和“超写实数字物平台”已在逾千家国内外企业得到规模化应用。 智能创意技术提供商,基于内容元素解构方法论AI人工智能、云计算、创意内容大数据等核心技术,提供创意智能生产、运营优化、标签洞察、协作管理的一站式SaaS解决方