您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[财通证券]:计算机行业专题报告:北美CSP如何看待AI投入——谷歌 - 发现报告
当前位置:首页/行业研究/报告详情/

计算机行业专题报告:北美CSP如何看待AI投入——谷歌

信息技术2024-09-08杨烨、罗云扬财通证券章***
计算机行业专题报告:北美CSP如何看待AI投入——谷歌

技术颠覆期,投资不足的风险远远高于投资过度。谷歌的搜索、YouTube、广告、云服务等业务与生成式AI契合度,同时,谷歌自身的大模型Gemini仍在不断迭代。公司在2024年Q2业绩说明会中提到生成式AI已经贡献数十亿美元收入。我们认为,谷歌以Deepmind为核心是上一轮以卷积网络AI革新的发起者,自身业务与生成式AI契合度高,有望持续加大对AI算力投入,以抢占领先地位。 搜索:高质量且普适化的AI搜索或需要更多算力支持。传统搜索市场中 , 不论是市场总量还是谷歌份额 , 都基本趋于饱和 , 谷歌需要利用Transformer架构中更智能的语义理解以及生成能力为其搜索全面赋能升级,不论是应对New bing等的挑战,或是对原有客群的价值深挖,都是谷歌接下来的重中之重。目前SGE存在“Quality and availability”限制,其重要原因之一或为算力不足,鉴于谷歌庞大的搜索客群,SGE的普及以及质量提升所需算力庞大。 广告:精准定位目标客户,快捷定制内容。广告业务作为谷歌主要利润构成之一,如何抓住此次AI浪潮对广告工具进行升级是谷歌的核心要务。总结而言是利用AI的“理解力”对用户精准定位,同时利用GenAI相应的文生文/图/视频/音乐等等功能快捷制作符合用户喜好的广告。我们认为,AI+广告的终极形态或为针对每个用户的独特喜好,向其推荐极具个性化的产品和推荐媒介,并延伸其社圈等,该终极形态所需算力亦极为庞大。 大模型:更大、更快、更强,Gemini力争抢占制高点。谷歌一直是AI技术创新的先行者之一,根据Artificial Analysis,Gemini的上下文长度远超同业水平。而经过分析数据并对比后我们发现,目前全球范围内,还没有兼具处理复杂任务和低时延高速度的模型,这或许是目前及未来包括谷歌、Open AI、Meta等厂商需要进一步抢占的方向。鉴于当前SOTA模型(GPT4)参数规模下经过近2年迭代出的各类小而精mini模型复杂任务能力欠缺,模型天花板或需要进一步膨胀才有望迭代出好用且能应对复杂任务的模型。换言之,训练算力需求广阔。 投资建议:见正文 风险提示:技术迭代不及预期的风险、商业化落地不及预期的风险、政策支持不及预期风险、全球宏观经济风险。 1技术颠覆期,投资不足的风险远远高于投资过度 生成式AI对谷歌业务契合度高,谷歌将持续加大投入。谷歌的搜索、YouTube、广告、云服务等业务与生成式AI契合度,已经陆续发布并迭代相关产品为其业务赋能。同时,谷歌自身的大模型Gemini仍在不断迭代,8月初发布Gemini实验版1.5 pro(0801)在Chatbot Arena超越GPT 4o-2024-0513版和Claude-3.5sonnet夺得第一,但随后又被GPT 4o-2024-0808版超越,基础大模型制高点之争激烈。 图1.谷歌capex(亿美元)及增速(2017Q1-2024Q2) 生成式AI已经贡献数十亿美元收入。公司在2024年Q2业绩说明会中提到“our AI infrastructure and generative AI solutions for cloud customers havealready generated billions in revenuesand are being used by more than 2 milliondevelopers.”。 我们认为,谷歌以Deepmind为核心是上一轮以卷积网络AI革新的发起者,自身业务与生成式AI契合度高,有望持续加大对AI算力投入,以抢占领先地位。 图2.谷歌2023Q3-2024Q2的earnings-call对AI与capex的讨论总结 Capex主要由基础设施投资驱动,AI是主线。谷歌CEO桑达尔·皮查伊表示,在科技领域中经历类似AI颠覆性转变时,投资不足的风险远远高于投资过度。考虑到持续增长的算力需求和成本,各个大公司都在自研芯片。谷歌的TPU(Tensor Processing Unit)以systolicarray为核心,专门用于机器学习工作,成为AI ASIC的标志性芯片。2024年5月15日推出第六代TPUTrillium,与TPU v5e相比,每个芯片的峰值计算性能提高了近5倍,能效提高了67%。另外,谷歌公布自研基于arm的中央处理器(CPU)Axion,性能比可基于x86的系统高出50%。同时,谷歌云将于2025年初引进最新的NVIDIA Blackwell,增强对高性能计算和AI工作负载的支持,尤其是以B200和GB200提供支持的虚拟机形式。 图3.谷歌AI ASIC发展历程 2AI为主业注入新活力,抢占SOTA模型制高点 2.1搜索:高质量且普适化的AI搜索或需要更多算力支持 传统搜索日趋饱和,AI注入新活力。根据Statcounter统计,2024年7月,Google Chrome在全球全渠道搜索引擎市场份额为65.39%,多年占据全球搜索引擎市场超过60%以上份额。细分渠道来看,2024年7月,谷歌在全球手机、桌面搜索引擎市场份额为66.45%和64.72%。AI提供了强大的新搜索方式,微软谷歌等搜索引擎巨头相继应用,微软率先取得成果。2023年2月,微软将Chat GPT整合到New Bing中,以新奇性吸引了大量用户,受到广泛关注,但市场份额没有明显变化。我们认为,传统搜索市场中,不论是市场总量还是谷歌份额,都基本趋于饱和,谷歌需要利用Transformer架构中更智能的语义理解以及生成能力为其搜索全面赋能升级,不论是应对New bing等的挑战,或是对原有客群的价值深挖,都是谷歌接下来的重中之重。 图4.全球全渠道搜索引擎市场份额 SGE成为新一代AI搜索引擎。2023年5月,谷歌推出了SGE(Search Generation Experience),这是一种面向搜索结果的新方法,通过AI为用户提供快速、清晰的搜索主题概述。传统搜索需要将复杂问题分解为较小的问题,自行整理可用的大量信息进行拼凑。SGE对于较长的查询等更复杂的问题特别有用,并且会建议后续步骤,包括进入一个新的对话模式,可以询问更多后续问题。同时,SGE可以在购物时帮助做出更快、更容易的购买决策。SGE可以生成符合要求产品描述、相关评论、价格和产品图片。 图5.Search powered by generative AI 推出Circle to Search功能,移动端搜索再创优势。Circle to Search允许用户在手机任何地方使用手势进行搜索,如画圆、加亮、涂鸦或点击,目前已有超过1亿台Android设备可以使用该功能。Lens通过镜头拍摄视频来提问进行视觉搜索。 在谷歌search lab官网中针对生成是AI赋能搜索的限制写到“Generative AI is experimental. Quality and availability may vary.”。我们认为,目前SGE存在“Quality and availability”限制的重要原因之一,或为算力不足,鉴于谷歌庞大的搜索客群,SGE的普及以及质量提升所需算力庞大。 图6.Circle to Search 2.2广告:精准定位目标客户,快捷定制内容 Pmax(Performance Max)打造全新广告体验,最大化广告效果。不同于传统PLA(标准购物广告),Pmax综合考虑竞价、目标定位、创意以及广告商体验,为广告商创造更多价值。广告商需要提供广告素材和目标,Pmax会使用自动出价策略,尽可能提高转化次数,目标广告支出回报率。2024年上半年以来,使用PLA的广告商的广告匹配表现提高了10%,在相同的成本下平均增加了超过25%的价值转化。 图7.Performance Max优势 推出Demand Gen功能,扩大广告影响力。谷歌升级Discovery广告后产生了Demand Gen,AI驱动形成广告变体并在Google最具吸引力的视觉平台(YouTube,Discover and Gmail)上投放广告,提供给最相关的潜在客户包括过去购买过、访问过网站或观看过YouTube视频的用户。谷歌营销团队使用Demand Gen为Pixel 8宣传活动创造了近4500个广告变体,以四分之一的成本提供了两倍的点击率。 图8.Search、Performance Max、DemandGen区别 AI持续赋能广告,功能性工具推陈出新。谷歌打造的很多产品都基于AI技术,大到Pmax(Performance Max)完全由AI赋能的产品,小到智能出价的具体功能,不断助力各种规模的商家实现业务增长。谷歌推出多项新功能帮助创作者以新的方式制作、编辑和分享内容并为消费提供优质内容。 1)Dream Screen为YouTube短片制作人提供AI工具用于更换新的背景,删除背景杂项,视频翻译成几十种语言,混合和剪辑视频。 2)Product Studio具有AI驱动的场景生成功能,帮助企业免费创建独特的定制图像,帮助商家将产品置于想象的任何场景中。 3)虚拟试穿和购物广告将在下半年推广,新功能带来的浏览量提升60%。 图9.product Studio简化产品设计流程 广告业务作为谷歌主要利润构成之一,如何抓住此次AI浪潮对广告工具进行升级是谷歌的核心要务。总结而言是利用AI的“理解力”对用户精准定位,同时利用GenAI相应的文生文/图/视频/音乐等等功能快捷制作符合用户喜好的广告。我们认为,AI+广告的终极形态或为针对每个用户的独特喜好,向其推荐极具个性化的产品和推荐媒介,并延伸其社圈等,该终极形态所需算力亦极为庞大。 图10.Dream screen一键制作视频并帮助深度分析浏览构成 2.3大模型:更大、更快、更强,Gemini力争抢占制高点 云计算早期开拓者,产品多元化发展。在2003年,谷歌相继发表了四篇为云计算基础架构奠定基础的论文,分别涉及分布式文件系统(GFS)、并行计算(MapReduce)、数据管理(BigTable)以及分布式资源。过去十多年,谷歌开始提供更为广泛的云计算基础设施与服务,涵盖计算、存储、数据库、数据分析、开发者工具以及机器学习等多个方面。 图11.谷歌云产品 Gemini兼具质量与性价比。据ArtificialAnalysis统计,Gemini 1.5 Pro模型效果名列前茅,MMLU得分为0.859,评测质量指数为72。Gemini 1.5 ProInput token每 1M 价格3.5美元,低于GPT-4o5美元,Output token每 1M 价格10.50美元。 低于GPT-4o15美元。谷歌还推出了针对速度和效率进行了优化的轻量级版本Gemini 1.5 Flash。更具体对比来看 图12.LLM模型上下文长度、效果、价格、延迟等对比 上下文长度是Gemini最突出的优势。根据ArtificialAnalysis,Gemini的上下文长度远超同业水平。 图13.LLM模型效果(竖轴)和上下文长度(横轴)对比 模型效果与定价大致成正相关。综合来看,大部分模型遵循模型效果(评分)与定价正相关关系(图中表现为集中在左下或右上)。图中GPT-4o mini和Llama 3.1 70B做到了效果好且定价低,我们认为,目前对大模型的评分基准无法全面测试大模型的能力,尤其在zero-shot方面,图中绿色部分之所以能做到所谓“高性价比”,是由于牺牲了针对复杂任务的处理能力,针对基准做了定向优化。以GPT4o和GPT-4o mini为例,虽然在下图中看上去mini版貌似显著“优于”4o原版,但open ai官网明确了两者的适用范围。 图14.LLM模型效果(竖轴)和定价(横轴)对比 只有小而精的模型做到了低时延高速度。 图15.LLM首token时延(竖轴)和token生成速度(横轴)对比 面向复杂任务的大模型仍无法做到