您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[民生证券]:计算机周报:谷歌Gemini大模型预示三大AI机会方向 - 发现报告
当前位置:首页/行业研究/报告详情/

计算机周报:谷歌Gemini大模型预示三大AI机会方向

信息技术2023-12-10民生证券话***
AI智能总结
查看更多
计算机周报:谷歌Gemini大模型预示三大AI机会方向

市场回顾 本周(12.4-12.8)沪深300指数下跌2.4%,中小板指数下跌1.78%,创业板指数下跌1.77%,计算机(中信)板块上涨0.74%。板块个股涨幅前五名分别为:信雅达、网达软件、当虹科技、苏州科达、万兴科技;跌幅前五名分别为左江科技、万集科技、金溢科技、天迈科技、创意信息。 公司动态 御银股份:12月04日,公司已收到南海集团支付的全部股份转让款,共计30,600.00万元 本周观点 我们在Gemini大模型发布前的本周周报《ChatGPT一周年:AI盛宴才刚刚开始》首次指出多模态AI应用、算力国产化、AI终端重构是新的三大AI机会方向,恰是Gemini大模型此次发布所代表的新趋势: 1)多模态AI应用:Gemini大模型最核心亮点在于对视频多模态的理解能力,拥有视频数据与应用卡位的企业或有重估机遇。 2)算力国产化:Gemini并没有依赖英伟达芯片算力,是由Google自研TPU v4和TPU v5e训练出来的大模型,值得关注的是谷歌设计的TPU细节的论文《数据中心的TPU效能解析》大量引用致敬我国【寒武纪】的研究工作,一方面给予我们国产算力崛起的信心,另一方面国内真正大客户互联网巨头开始批量采购华为昇腾、寒武纪为代表国产AI芯片拐点已经到来。 3)AI终端重构:谷歌同时发布Gemini Nano这一专门为移动设备训练的模型。针对不同内存的设备,训练了两个版本,参数量分别是18亿和32.5亿。 大模型重构各类终端的趋势再度确认,我们将迎来前所未有终端硬件创新潮。 投资建议:1.建议关注芯片基础算力国产化与一体机相关标的:华为昇腾一体机:科大讯飞、云从科技、软通动力、恒为科技、安恒信息;国产核心算力:寒武纪、浪潮信息、海光信息、超讯通信、汇纳科技。2.从AI PC到AI pin的AI终端变革:大模型重构有望从AI PC开始共振,逐步延伸至汽车、手机与机器人等各类终端,或将迎来全面一轮的AI终端硬件创新潮,建议关注充分布局AI终端相关标的:中科创达、萤石网络、漫步者等。3.海外在大模型持续赋能下,已明确其商业化规模落地的成功之路。国内在各大模型基本具备GPT3.5水平能力下,以及政策的持续推动,AI应用有望复制海外的成功路径,建议关注相关AI应用标的:效率办公-金山办公、AI司法-金桥信息、GPTs分发渠道-梦网科技、AI空间计算-超图软件、AIGC创作-万兴科技、超讯通信、教育-佳发教育、邮箱-彩讯股份、社交-掌阅科技等。 风险提示 政策落地不及预期;行业竞争加剧。 1本周观点 1.1谷歌发布全球首个端到端多模态大模型——Gemini Gemini系列模型是一开始就使用多模态数据(包括文字、音频、图片、视频、PDF文件等)训练的大模型,其中视频数据训练是通过将视频编码为一系列帧序列,视频帧(图像)可以与文本或音频实现混合训练。 图1:Gemini大模型架构图 Gemini系列模型分为Ultra、Pro、Nano三个版本,都支持上下文32K理解,其中: 1)Ultra版本是性能最强的版本,在对应的TPU基础设施中能够展现出最高效率,在多项测试中Ultra版本性能超过GPT4V(后文有详细测试结果); 2)Pro版本是性价比优化的版本,在推理、多模态等方面有较强能力,Pro版本具有良好延展性,可以在几周内完成预训练,在多项测试中仅次于GPT4V,强于PaLM2、Claude2、LLaMA2、GPT3.5等主流大模型; 3)Nano是通过对其他模型蒸馏得来的4位模型,有1.8B和3.25B两个版本,分别针对低内存和高内存设备,支持在本地部署 GeminiUltra版本在32个学术基准中,有30个超过GPT4V处于全球最先进水平。据谷歌黑板报,Gemini Ultra的得分率为90.0%,是第一个在MMLU(大规模多任务语言理解)测试中超过人类专家的模型,MMLU综合使用了数学、物理、历史、法律、医学和伦理等57个科目,用于测试世界知识和解决问题的能力,在包括文本和编码在内的一系列基准测试中,Gemini的性能都超过了当前最先进的水平。 图2:GeminiUltra在文本领域各类测试表现 在图像基准测试中,Gemini Ultra在不使用对象字符识别(OCR)系统来提取图像中的文本进行下一步处理的情况下,表现优于以前最好的模型。这些基准测试凸显了Gemini的原生多模态性,并显示出了Gemini具有更复杂推理能力的潜力。在新的MMMU基准测试中,Gemini Ultra也取得了得分率为59.4%的优异成绩,该基准测试由横跨不同领域、需要仔细推理的多模态任务组成。 图3:谷歌多模态领域各类测试表现 Gemini端到端多模态能力带来差异性竞争优势。据谷歌黑板报微信公众号,到目前为止,创建多模态模型的标准方法是分别训练不同模态的组件,然后将它们拼接在一起,以粗略模拟某些功能。这些模型有时可以很好地完成描述图像等特定任务,但在概念性更强、更复杂的推理方面却显得力不从心。而谷歌将Gemini设计为原生多模态,从一开始就在不同模态上进行预训练。然后,我们利用额外的多模态数据对其进行微调,以进一步提高其有效性,这有助于Gemini从最初阶段就能对输入的各种内容顺畅地进行理解和推理,远远优于现有的多模态模型,其能力几乎各个领域都是最先进的,具体来说Gemini在复杂推理、多模态理解、高级编码等领域表现优异: 1)复杂推理:Gemini拥有通过阅读、过滤以及理解信息,从数十万份文件中提取见解的卓越能力,将有助于在从科学到金融等多个领域以数字化速度实现新的突破; 2)多模态理解:Gemini 1.0经过训练,可以同时识别并理解文本、图像、音频等,因此它能更好地理解具有细微差别的信息,回答与复杂主题相关的问题。 这就让它尤其擅长解释数学和物理等复杂科目中的推理; 3)高级编码:以基于Gemini训练的AlphaCode 2代码生成系统为例,该系统擅长解决那些不仅需要编码能力而且也需要复杂数学和理论计算机科学知识的竞赛性编程问题,当程序员与AlphaCode 2合作,为示例代码定义某些属性时,它的表现甚至更好。 1.2TPU:谷歌Gemini的算力基础并不依赖英伟达 谷歌使用TPUsv4和v5e通过AI优化过的基础设施上对Gemini 1.0进行了大规模训练。据谷歌黑板报微信公众号,在TPUs上,Gemini的运行速度明显快于早期规模更小、性能更弱的模型,这些定制设计的AI加速器一直是Google服务数十亿用户的AI赋能产品的核心,如Search、YouTube、Gmail、Google Maps、Google Play和Android,它们还使得世界各地的公司能够经济高效地训练大规模的AI模型。 图4:谷歌TPU发展历程 谷歌发布最新款AI芯片——TPU V5p,芯片算力与片间互联能力进一步提升。据谷歌云官网,最新一代TPUV5p单芯片算力达到459TFLOPs(Bf16),最高支持8960片TPU组合超级节点并带来高达4800Gb/s的片间互联速度。 图5:谷歌TPU横向对比 1.2.1谷歌TPU与中国AI芯片企业寒武纪有着微妙联系: 2012年,陈天石等中科院计算所的科研人员,与首次提出“AI加速器”概念的法国教授Olivier Temam,共同启动神经网络处理器(AI芯片)项目进行了一系列开拓性学术工作,已经成为全球AI芯片领域引用次数最多的学术论文,成为世界范围内研发智能芯片必读的文献。这也是寒武纪的技术来源。 2014年12月,DaDianNao(又称寒武纪2号神经网络处理器,面向大规模神经网络的应用)荣获2014年度Micro最佳论文,这也是Micro自1963年创办以来,第一次由美国以外的研究者摘得该奖项。 2017年,美国人工智能的领军企业谷歌首次发表了详细介绍其自行设计的AI芯片TPU细节的论文 《 数据中心的TPU效能解析 》(In-Datacenter Performance Analysis of a Tensor Processing Unit),共同作者多达70人,领衔第一作者是计算机体系架构硬件大师Norman Jouppi。令人震惊的是,这篇详细介绍TPU细节的论文引用了国内刚刚刚成立不久的AI芯片公司寒武纪团队成员前期发表的6篇学术论文,并有专门段落回顾一系列学术工作显示尊重,这在几乎由美国垄断的计算机基础体系架构设计领域,在全球范围内都是极为罕见的。 图6:2017年4月谷歌首次发表了详细介绍其自行设计的AI芯片TPU细节的论文《数据中心的TPU效能解析》 据CSDN,TPU相比GPU通用性更弱,但特定任务的处理速度和能耗优化程度将显著领先,AI时代TPU商业化能力的一大前瞻指标为TPU适配大模型情况: 1)谷歌TPU:据谷歌云官网,AI大模型客户包括Anthropic、Salesforce、Lightstricks、AssemblyAI、Huggingface等; 2)寒武纪:据英伟达官网,寒武纪思元(MLU)系列云端智能加速卡与百川智能旗下的大模型Baichuan2-53B、Baichuan2-13B、Baichuan2-7B等已完成全面适配,寒武纪思元(MLU)系列产品性能均达到国际主流产品的水平。 1.3多模态AI应用浪潮或开启 谷歌Gemini演示视频所有用户提示和输出都是真实的,只是为了简洁起见进行了缩短。据CSDN,Gemini演示视频中仿佛可以实时观察人类的行为,如观察人类在做什么,并给予反馈:例如,Gemini看到一只鸭子从草图到填色的整个过程,可实时给出解释和反馈,还能在换杯游戏中追踪纸团、辨别各种手势、重新排列行星草图等;后续,针对网络质疑,谷歌DeepMind研究副总裁Oriol Vinyals追加补充视频中的所有用户提示和输出都是真实的,只是为了简洁起见进行了缩短。 Gemini开始在谷歌多种产品和平台推出。据谷歌黑板报,Bard将使用Gemini Pro的微调版本来进行更高级的推理、规划和理解等;Pixel 8 Pro是首款搭载Gemini Nano的智能手机,它可以支持录音应用中的“总结”等新功能,并在Gboard中推出“智能回复”功能,从WhatsApp开始,明年还将推出更多信息应用;未来几个月,Gemini将应用于我们更多的产品和服务,如Search、Ads、Chrome和Duet AI;公司已经开始在Search中试验Gemini,它能够为用户提供更快的搜索生成体验(SGE),用户在美国的英语搜索延迟降低了40%,同时在质量方面也有所提高。 1.4投资建议 我们在Gemini大模型发布前的本周周报《ChatGPT一周年:AI盛宴才刚刚开始》首次指出多模态AI应用、算力国产化、AI终端重构是新的三大AI机会方向,恰是Gemini大模型此次发布所代表的新趋势: 1)多模态AI应用:Gemini大模型最核心亮点在于对视频多模态的理解能力,拥有视频数据与应用卡位的企业或有重估机遇。 2)算力国产化:Gemini并没有依赖英伟达芯片算力,是由Google自研TPU v4和TPU v5e训练出来的大模型,值得关注的是谷歌设计的TPU细节的论文《数据中心的TPU效能解析》大量引用致敬我国【寒武纪】的研究工作,一方面给予我们国产算力崛起的信心,另一方面国内真正大客户互联网巨头开始批量采购华为昇腾、寒武纪为代表国产AI芯片拐点已经到来。 3)AI终端重构:谷歌同时发布Gemini Nano这一专门为移动设备训练的模型。针对不同内存的设备,训练了两个版本,参数量分别是18亿和32.5亿。 大模型重构各类终端的趋势再度确认,我们将迎来前所未有终端硬件创新潮。 投资建议:1.建议关注芯片基础算力国产化与一体机相关标的:华为昇腾一体机:科大讯飞、云从科技、软通动力、恒为科技、安恒信息;国产核心算力:寒武纪、浪潮信息、海光信息、超讯通信、汇纳科技。2.从AI PC到AI pin