您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[德邦证券]:计算机:谷歌大模型Gemini正式发布,全球AI赛道或迎加速催化 - 发现报告
当前位置:首页/行业研究/报告详情/

计算机:谷歌大模型Gemini正式发布,全球AI赛道或迎加速催化

信息技术2023-12-10钱劲宇德邦证券七***
计算机:谷歌大模型Gemini正式发布,全球AI赛道或迎加速催化

请务必阅读正文之后的信息披露和法律声明 [Table_Main] 证券研究报告 | 行业点评 计算机 2023年12月10日 计算机 优于大市(维持) 证券分析师 钱劲宇 资格编号:S0120523090002 邮箱:qianjy5@tebon.com.cn 市场表现 相关研究 1.《新晨科技(300542.SZ):发布向特定对象发行A股股票定增预案,有望增强主营业务,实现可持续发展》,2023.12.7 2.《Pika 1.0发布,多模态AIGC应用有望加速落地》,2023.12.3 3.《领导权风波平息,OpenAI有望继续推动全球AI发展》,2023.11.28 4.《2023全球数商大会在沪召开,“数据要素X”行动有望加速数据要素产业进程》,2023.11.27 5.《Citrix退出中国,深信服有望成为客户首选》,2023.11.24 谷歌大模型Gemini正式发布,全球AI赛道或迎加速催化 [Table_Summary] 投资要点:  Gemini 1.0 正式上线,谷歌大模型迈出重要一步。12 月 6 日,谷歌正式发布 Gemini 1.0,Gemini 1.0 提供了三个不同的尺寸版本:1)Gemini Ultra:规模最大、能力最强,用于处理高度复杂的任务;2)Gemini Pro:在各种任务上扩展的最佳模型;3)Gemini Nano:用于端侧(on-device)任务的最高效模型。Gemini 在设计时原生地支持多模态,从一开始便在不同模态上进行了预训练,然后利用额外的多模态数据进行微调以提升有效性。因此,Gemini 能够无缝地理解和推理各种输入,这也是谷歌在大模型方面迈出的关键一步。  Gemini有望赋能现有业务,谷歌旗下产品有望全线升级。据机器之心消息,谷歌将在其旗下产品中添加 Gemini,例如 Bard 将使用 Gemini Pro 的微调版本来执行更高级的推理、规划、理解等任务,这也是 Bard 自推出以来最大的升级。升级版 Bard 将在 170 多个国家/地区提供英语版本,并且在不久的将来扩展到更多模态,并支持更多种语言。此外,谷歌还将 Gemini 引入了 Pixel,Pixel 8 Pro 将是第一款运行 Gemini Nano 的智能手机。在接下来的几个月中,Gemini 将陆续出现在谷歌更多的产品和服务中,包括搜索、广告、Chrome、Duet AI 等。  大厂技术竞赛加速全球AI发展,AI赛道有望持续受益。技术研发上,为了与 OpenAI 和微软展开竞争,谷歌从 PaLM 2 切换到了 Gemini,甚至在今年 4 月直接把Google Brain和 DeepMind 合并在了一起,Gemini 由新组成的 Google DeepMind 汇合两个实验室的力量进行攻关。产品应用上,此前微软在Ignite大会上已宣称Copilot将赋能自家产品,此次谷歌也宣布将通过旗下产品将Gemini推向数十亿用户。AI产业的头部公司竞相实现技术与产品迭代,有望持续催化AI产业繁荣发展。  建议关注:焦点科技、万兴科技、虹软科技、科大讯飞、金山办公、福昕软件、同花顺、高新发展、神州数码、广电运通、龙芯中科、海光信息。 后文附录为德邦计算机团队关于Gemini1.0的实测体验,测试产品为谷歌旗下已融入Gemini Pro功能的Bard,对照产品为OpenAI旗下ChatGPT4,实测过程均由团队成员自行把握。 Bard入口:https://bard.google.com/chat ChatGPT4入口:https://chat.openai.com/  风险提示: AI技术落地不及预期、市场需求不及预期、全球供应链风险加剧 -17%-9%0%9%17%26%34%43%2022-122023-042023-08计算机沪深300 行业点评 计算机 2 / 8 请务必阅读正文之后的信息披露和法律声明 附录: Gemini使用实测及体验总结: 【重点更新】 (1)Gemini多模态:支持文本、图像、视频、音频输入,支持文本和图像输出。 (2)Gemini三个版本:Ultra、Pro、Nano。 (3)AlphaCode2:Gemini加成,擅长编程、涵盖了复杂的数学和理论计算机科学等问题。 (4)视频理解方面:从官方的演示视频里我们可以看到,Gemini对于演示人员的动作可以进行分析和推理,并且实时性很高。从类人角度看,实现了听、说、看、互动等,甚至可以同时识别和理解文本、图像和视频。 (5)应用融合情况:Bard 和 Pixel 8 Pro 智能手机已经应用了Gemini,未来Gemini会被整合到Google的搜索引擎、广告产品、Chrome浏览器等。 (6)硬件层面:用了谷歌的TPU集群。Gemini Ultra用了最新版本的 v5p,如图v5p在互联带宽方面的提升更显著。 图1:谷歌不同TPU 加速器参数对比 资料来源:半导体行业观察,德邦研究所 【Bard体验】 最新的美区Bard已经引入了Gemini Pro的部分能力,但目前只支持英文。 图2:Bard美区更新日志 行业点评 计算机 3 / 8 请务必阅读正文之后的信息披露和法律声明 资料来源:Bard官网,德邦研究所 根据Gemini论文数据,Gemini Ultra的性能在自然图像、音频、视频理解、数学推理等方面超过或接近GPT-4。 图3:Gemini与其他大模型参数对比 资料来源:Google Deepmind官网,《Gemini: A Family of Highly Capable Multimodal Models》,德邦研究所 体验环节:当前根据Bard接收输入的数据类型,我们主要进行了图像识别、理解能力方面的体验。 让Bard分析指数走势,如图所示,Bard从日K、技术指标、基本面来进行了分析。并与GPT4对比。 行业点评 计算机 4 / 8 请务必阅读正文之后的信息披露和法律声明 图4:Bard关于证券走势的分析 资料来源:Bard,德邦研究所 图5:Bard关于证券基本面的分析 资料来源:Bard,德邦研究所 行业点评 计算机 5 / 8 请务必阅读正文之后的信息披露和法律声明 图6:Bard关于证券技术指标的分析 资料来源:Bard,德邦研究所 同样的prompt问GPT4,GPT4的回答是图中指标的解释,与走势不大相关。(中文版) 图7:ChatGPT4关于证券走势的分析(中文版) 资料来源:ChatGPT4,德邦研究所 (英文版)仍然是解释图中指标,并没有进行走势的分析。 行业点评 计算机 6 / 8 请务必阅读正文之后的信息披露和法律声明 图8:ChatGPT4关于证券走势的分析(英文版) 资料来源:ChatGPT4,德邦研究所 总体来看,从语义理解以及回答的相关度及逻辑来看,在该prompt的情景下,Bard更贴近用户需求,但是准确度仍需提升。 官网演示视频截图在Bard中体验: (1)一开始识别成了一条蛇。 (2)这次识别出来是一只鸟,并猜测是天鹅,因为Bard觉得天鹅更受欢迎。 (3)最后成功识别出了鸭子、水面、波浪,但是忽略了蓝色,有一些幻觉例如水面上的鸭子倒影。总体来看对于图片的描述较为符合。 图9:谷歌官网演示视频截图在Bard中的测试 资料来源:Bard,德邦研究所 行业点评 计算机