您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国投证券]:传媒行业动态分析:AIGC专题报告十四-Gemini 助力应用落地出爆款 - 发现报告
当前位置:首页/行业研究/报告详情/

传媒行业动态分析:AIGC专题报告十四-Gemini 助力应用落地出爆款

文化传媒2023-12-15焦娟国投证券L***
AI智能总结
查看更多
传媒行业动态分析:AIGC专题报告十四-Gemini 助力应用落地出爆款

2023年12月15日 传媒 Gemini助力应用落地出爆款——AIGC 专题报告十四 AI产业投资浪潮进入第二轮应用落地的阶段,适逢谷歌Gemini的推出。2023年12月7日,谷歌发布Gemini多模态大模型,多模态囊括了现有的视频、图像、声音、代码、图片等各种内容形态。Gemini 区分了三个版本:最大的ultra、中间的pro以及针对移动端的nano存在三个参数大小和应用场景的切分设计,对场景、应用极其友好;因有了视频性能与能力,更易于被市场理解、业态更多样性。 Gemini原生且多模态的模型,在应用端的重要性预计将得到明显的呈现,会比GPT大语言模型更为重要。GPT是一个大语言模型(LLM),而Gemini可以简单理解为是一个大视觉模型(LVM)。大语言模型, 是一个用文本进行收敛与交互的形态,底层需要大量的技术性的积累以及结构化的数据。Gemini则是对标GPT大语言模型的一个大视觉多模态模型,囊括了现有的视频、图像、声音、代码、图片等各种内容形态。文字、图片并非当下内容产业的主流内容形态,GPT尚未出现爆款应用;而多模态的Gemini对视频内容制作、视频内容分发变现的影响将更加直接。 GeminiVSGPT,是谷歌与微软在AGI方向上的持续PK。谷歌Gemini与微软GPT这两大阵营背后,微软在操作系统积累了很好的数据,谷歌的也占据很庞大的应用生态。微软虽然具备先发优势,但谷歌to C霸主地位同样不容小觑。OpenAI强调借助其模型可搭建小的GPTs到应用商店去卖,故微软相对缺乏消费者端的强抓手;谷歌Gemini的Nano版本,天然有谷歌安卓设备的硬件加持,很容易获得消费者及真实世界的数据反馈。除此之外,Meta(Llama2)、苹果(VisionPro)、特斯拉(人形机器人)也将成为竞争格局的重要参与方。 投资角度,24、25年产业逻辑很清晰——落地应用出爆款。选股方面,相对复杂,一方面期待现有上市公司通过三种路径(资源禀赋抢先发优势、投资收购快速切入、紧随大巨头的生态建设)切入景气上 行的诸多方向;另一方面期待上市公司(尤其国企)通过并购重组进入景气上行的众多部位。 投资建议:关注芒果超媒、博纳影业、华策影视、华谊兄弟;华媒控股、时代出版、南方传媒、粤传媒、华数传媒、湖北广电、电广传媒、新媒股份、中信出版、川网传媒、读客文化、中文传媒、东方明 珠、中国科传、浙版传媒;世纪华通、姚记科技、掌趣科技;思美传媒、天地在线、电声股份、返利科技、兆讯传媒;昆仑万维、掌阅科技;传智教育、力盛体育、国旅联合、祥源文旅;腾讯、中手游。 风险提示:治理风险;升级迭代、转型革新进度低于预期。 行业动态分析 证券研究报告投资评级领先大市-A维持评级 首选股票目标价(元)评级 传媒 沪深300 55% 45% 35% 25% 15% 5% -5% -15% 2022-122023-042023-082023-12 行业表现 升幅%1M 相对收益11.6 绝对收益5.1 3M 20.6 10.4 12M 48.2 33.0 资料来源:Wind资讯 焦娟分析师 SAC执业证书编号:S1450516120001 jiaojuan@essence.com.cn 相关报告OptimusGen2再现阶段性 2023-12-13 成果,人形机器人确定性持续增强互动剧游戏类比页游,期待 2023-11-13 新公司系列化跑出互动剧游戏,是影视还是游 2023-11-05 戏?未来内容形态的雏形空间计算是一种时代颠覆且 2023-10-31 必然到来——以AppleVisionPro为基准,围绕空间计算的定性分析与定量比较关注“应用落地”逻辑催化 2023-10-29 阶段四条主线——AI专题报告之十三 内容目录 1.产业浪潮第二轮应用落地,适逢Gemini推出3 2.巨头积极卡位,助推应用落地出爆款4 2.1.Gemini为何很重要?更能直接用于“应用”4 2.2.GeminiVSGPT,本质是谷歌直面与微软的竞争4 3.投资建议5 4.风险提示5 图表目录 图1.传媒行业指数变化趋势复盘(22Q4至今)3 1.产业浪潮第二轮应用落地,适逢Gemini推出 我们在《AIGC专题报告十三——关注“应用落地”逻辑催化阶段四条主线》中,由企业生命周期理论出发推演出AI大模型引发的技术变革推动的产业新周期,分别是导入期、成长期、成熟期、衰退期。产业周期的四个不同阶段,通常对应着三轮大的投资行情:第一轮是偏概 念性的主题性机会,新技术的影响已经被市场广泛认知,但是技术仍然有很多难题有待解决, 此时投资的核心关注逻辑在于企业是否积极拥抱新技术,相应的对公司存在一定的宽容度,因而也很容易出现估值泡沫;第二轮是偏落地应用出现的阶段,开始有一部分企业能够利用新技术提升产品能力,能够吸引一部分的用户尝试购买或者能产生一定的经营效益,市场会重点投资这类已经兑现产业预期的公司,将其作为未来行业的潜在龙头进行估值定价;第三轮就是关注业绩产出,即投资者要挑选出持续贡献收入或者降低成本的企业,在这一阶段不仅需要纵向对比公司的历史业绩,还需要横向对比同业的经营能力,市场投资要求更加苛刻。 映射到AI产业投资,第一轮的主题性投资机会,源于ChatGPT的技术突破。本质上是OpenAI在Transformer架构的基础上提出GPT的模型并跑通了“预训练-微调”的模式,同时,GPT模型在语言、多模态问题上有很强的表现,打开了技术的应用想象力。市场快速达成AI将引起第四场工业革命的共识,资金形成合力快速向AI赛道涌入,推高了资本泡沫。全球科技巨头也先后跑步进入赛场,海内外大模型企业以及各行各业竞相拥抱AIGC。 第二轮应用落地的阶段,适逢Gemini的推出。在这一阶段,初期大模型本质上没有实质性的差异,各家均处于抢跑或入局阶段,未来的差异将出现在生态圈的构建思路以及后续推出爆款的呈现上。首先,大模型厂商入局去搭建基于自身资源禀赋的大模型或中模型;其次,大模型需要许多合作伙伴,共同构建一个大型生态圈;再次,在大模型联合生态圈的合作伙伴,一起去定义出用户需求的过程中,发掘出细分需求、提高效率、增强变现能力等效用发挥出来的过程,即爆款应用出现的过程。2023年12月7日,谷歌发布Gemini多模态大模型,多模态囊括了现有的视频、图像、声音、代码、图片等各种内容形态。而越是多模态,AI在应用端的价值体现将更加极致,最终走向通用人工智能AGI的人形机器人就需要各种模态来做一个很好的融合。 从历史行情看,2023年上半年围绕AI技术变革所引发的股价上涨,主要对应于第一阶段的主题性机会,是因为技术突破后而随着投资者对于AI技术及产业发展认知加深,市场更关注相关公司产品的落地情况,比如ToC工具型产品的用户规模增长、付费用户渗透率等指标,由于落地阶段的差异,AI行业的个股出现股价走势的分化,同时板块进入阶段性的调整期,至2023年10月24日收盘传媒(中信)指数为2325.35,阶段性触底。后随着产业第二阶段的“应用落地”逻辑的持续催化,文生视频Pika1.0出圈,谷歌Gemini推出等,预计将迎来传媒板块普涨。 图1.传媒行业指数变化趋势复盘(22Q4至今) 4000 3500 3000 2500 2000 1500 2022-10-102022-12-282023-03-272023-06-202023-09-112023-12-07 资料来源:Wind、安信证券研究中心(注:数据截止至2023.12.12,为传媒(中信)指数) 2.巨头积极卡位,助推应用落地出爆款 2.1.Gemini为何很重要?更能直接用于“应用” 12月7日,谷歌宣布发布新一代大模型Gemini,再次引发市场对人工智能产业的持续关注。Gemini模型作为谷歌以及全球范围内最先发布的多模态模型,在性能上是第一个在MMLU上超越人类专家的模型。模型根据体量大小分为GeminiUltra、GeminiPro、以及GeminiNano三个版本,支持在云端以及边缘测运行。 谷歌在发布会上表示,目前,Gemini的初始版本已在Bard(12月6日)中提供,开发人员版本将于12月13日通过GoogleCloud的API提供。根据谷歌的计划,Bard将使用GeminiPro的微调版本进行更高级的推理、计划、理解等。谷歌还将Gemini引入Pixel,Pixel8Pro是第一款搭载GeminiNano的智能手机。预计在接下来的几个月里,Gemini将出现在谷歌体系内更多产品和服务中,如搜索、广告、Chrome和DuetAI。 Gemini的应用意义可能比GPT更为重要。GPT是一个大语言模型(LLM),而Gemini可以简单理解为是一个大视觉模型(LVM),参照内容形态的变迁,类似文本时代到如今的短视频时代,中间历经图片、音频、长视频等。大语言模型,是一个用文本进行收敛与交互的形态, 底层需要大量的技术性的积累以及结构化的数据。Gemini则是对标GPT大语言模型的一个大视觉多模态模型,囊括了现有的视频、图像、声音、代码、图片等各种内容形态。文字、图片并非当下内容产业的主流内容形态,GPT尚未出现爆款应用;而多模态的Gemini对视频内容制作、视频内容分发变现的影响将更加直接。 同时,从技术路径的角度,我们认为Gemini比GPT的级别要高一点。ChatGPT也好,Gemini也好,人形机器人也好,未来的一种新的技术路径也好,最终都是通往通用人工智能过程中不同的技术路径。ChatGPT其实是用语言的方式,建模的形态,用符号学去收敛出一些正确的答案。而Gemini则更像是具身智能的“脑子”,或至少是具身智能的“脑子”当中的一种工程方案,在通向AGI的技术路径上的级别会比ChatGPT更高一点。 再远一点,我们去看软硬件怎么样结合,就会涉及到巨头们竞争与合作的关系。其中,谷歌和苹果是典型的封闭与开源两大阵营的领头羊。微软、谷歌、Meta,硬件基因相对不足,如何与有硬件基因的苹果、特斯拉竞争与合作,是应用落地出爆款阶段的重要看点。 2.2.GeminiVSGPT,本质是谷歌直面与微软的竞争 复盘过去十年海外AI竞争史,关键看微软、谷歌、Meta这三家的向前发展。微软&OpenAI的GPT爆火之后,谷歌和Meta也在蓄力,这一次谷歌Gemini的“秀肌肉”也同样是业内期待已久的亮相。我们认为,在通向通用人工智能AGI的路上,海外每一家巨头都自成一个阵营,每一家都会积极卡自己的生态位。 我们认为,这一轮的GeminiVSGPT,本质是谷歌对微软的反击/跟进。Gemini与GPT的对比——大语言模型本质上是压缩文本世界,互联网上的文本相当于二手信息,总结、认知都 有偏见或局限性;多模态相当于对整个全面的现实世界的压缩,从神经网络的结构设计、数据清洗、渲染模型的成本完全不同,对整个模型训练是巨大的挑战。Gemini相比GPT大语言模型最突出的特点就是原生与多模态。 原生:从最开始做AI训练时的训练数据本身就是多样性的,不同于语音只有语音的数 据训练、图像就只有图像数据;一开始的出发点就是原生物(架构不同),是用多模态的 数据进行训练、得出多模态的结果。 多模态:不是多元素的简单堆砌,而是有效组合;如根据教学规律和要求,将多元素作为一个整体进行融合,根据场景要求以有序的信息流的形式传递,再通过产品特质,达到与其用户交互、交换的目的。 多模态很像N年前的“多媒体”,用户使用常规编程软件如FLASH(需要人工干预),借助于它,将无序的数据要素整理成有序的信息流,然后以多模态的数字化内容形式传递给用户,至于内容载体,则是光盘、网页、APP、小程序等。 GPT5和Gemini的发布,是AI2024年最大的看点之一,这两大阵营背后,微软在操作系统积累了很好的数据,谷歌的也占据很庞大的应用生态。微软虽然具备先发优势,但谷歌toC霸主地位同样不容小