您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国盛证券]:全球顶尖大模型厂商巡礼 - 发现报告
当前位置:首页/行业研究/报告详情/

全球顶尖大模型厂商巡礼

信息技术2023-04-02刘高畅国盛证券自***
全球顶尖大模型厂商巡礼

请仔细阅读本报告末页声明 证券研究报告 | 行业周报 2023年04月02日 计算机 全球顶尖大模型厂商巡礼 大模型是AIOS时代赔率最高的赛道,谷歌与OpenAI两大王者巅峰对决。1)Plugins的发布意味着AIOS大时代的来临, AIOS既是系统也是入口,具有大模型能力潜力、生态能力优秀的科技厂商会更加重要。以OpenAI为代表的基础模型能力边界还在不断的拓宽,有望占据价值链中最主要的环节,成为AIOS时代赔率最高的方向。2)在AI竞赛中,Google与OpenAI率先布局,两者相辅相成,并各自具备侧重点。一方面,OpenAI在transformer架构、RLHF、Instruction Tuning上与Google同源;另一方面,OpenAI与Google在技术架构与应用层面形成两条发展路线。在技术架构上,OpenAI的GPT是纯解码器模型,属于侧重生成的单向模型,而Google的BERT是纯编码器模型,属于侧重理解的双向模型;在应用领域上,OpenAI更具通用性,GPT模型微调与多模态构成万物互联基础,使用基础模型做细分领域数据微调具备极大优势,效果上基础模型通用性高;Google向全能型发展,相比GPT-4,PaLM-E在机器人操作规划、视觉问题解答、生成字幕等方面更加全能,可处理视觉、语言和传感器,极可能应用到工业生产。 其他科技大厂:多角度寻找切入点,团队建设相对早期。1)其他科技大厂布局也在火速铺开,与Google和OpenAI相比,以meta、amazon、tesla、apple为代表的其他科技大厂由于切入相对较晚,从硬件端、模型端、应用端等多角度各自发力,寻找侧重点追赶AI浪潮。2)META:模型体量相对较小,参数范围包括7B、13B、33B和65B,LLaMA-13B在大多数基准测试中都优于 OpenAI 的 GPT-3 (175B),有望成为小型企业的福音。3)Amazon: AWS与AI创企Hugging Face扩大合作,加速构建生成式AI应用的大型语言模型和大型视觉模型的训练、微调和部署,云计算客户可通过Amazon SageMaker程序访问Hugging Face的AI工具,针对特定用例进一步优化其模型的性能,侧重缩短时间与降低成本。4)Tesla:根据The Information报道,马斯克与前DeepMind研究员Igor Babuschkin接洽,希望由他领导建立AI实验室。目前Dojo在经典图像分类模型ResNet-50下,可实现比A100更高的帧率;在自动标注和占用神经网络下,性能远超A100,未来随着大模型在通用机器人领域应用,特斯拉有望获得更大空间。5)苹果:公司正在测试自然语言生成,代号为“Bobcat”的新项目将从最新的tvOS 16.4测试版开始进行测试,最终将进入苹果的其他操作系统。 六大初创公司:人才与资本加速入局,顶尖闭源落后开源。1)Anthropic:由OpenAI前元老创立,目标为AI安全与大模型研究,已获谷歌4亿美金投资。已推出聊天机器人产品Claude,与ChatGPT构成竞争,在部分任务上,可以表现出比GPT3.5更优秀的响应速度。2)Adept.ai:成立于2022年,致力于完成一款能够代替人类使用电脑、操控软件的AI助手,旗下模型ACT-1还处于雏形阶段,但根据公司给出的demo,已经可以完成通过自然语言指令自动在房产网页上寻找合适房源,或者在Salesforce上自动添加人员信息等任务。3)Character. AI由由前谷歌研究人员Shazeer和De Freitas创立,Shazeer为Transformer作者之一,代表产品为带有角色特征、人物个性,及上下文对话的聊天机器人,用户可选择不同角色(可以是真实,也可以是虚构的)对话,同时在对话中可影响角色。最近一轮融资估值已达10亿美元。4)Inflection AI由LinkedIn 联合创始人Hoffman、DeepMind联合创始人Suleyman、前DeepMind研究员Simonyan联合创立,即将开始测试一款消费类产品,目前正在构建的会话型人工智能,并不会回答每一个主题的问题,但将专门协助用户的在线任务,如进行预订和购买。Infelction AI目前已获得2.25亿美元的股权融资。5)Cohere公司是NLP模型提供商,创始人来自谷歌AI团队,包括transformer作者,正在开发面向企业用户的类ChatGPT模型。6)Hugging Face公司开发使用机器学习构建应用程序的工具,包括各种机器学习库,并运营让用户共享模型和数据集的开源交流平台。 推荐标的: 1)大模型厂商:360、科大讯飞、云从科技、昆仑万维。 2)大模型生态厂商:阿里系、华为系、百度系、腾讯系。 风险提示:AI技术迭代不及预期风险;经济下行超预期;行业竞争加剧风险。 增持(维持) 行业走势 作者 分析师 刘高畅 执业证书编号:S0680518090001 邮箱:liugaochang@gszq.com 相关研究 1、《计算机:1999年互联网行情复盘》2023-03-27 2、《计算机:华为盘古×META进阶篇》2023-03-26 3、《计算机:PLUGINS发布,AIOS超级时代如何选应用?》2023-03-26 -32%-16%0%16%32%2022-042022-082022-112023-03计算机沪深300 2023年04月02日 P.2 请仔细阅读本报告末页声明 内容目录 1. 大模型是AIOS时代赔率最高的赛道,谷歌与OpenAI两大王者巅峰对决................................................................ 3 2. 其他科技大厂:多角度寻找切入点,团队建设相对早期 ......................................................................................... 8 3. 六大初创公司:人才与资本加速入局,顶尖闭源落后开源 ................................................................................... 11 4. 推荐标的 ......................................................................................................................................................... 18 5. 风险提示 ......................................................................................................................................................... 19 图表目录 图表1:LLM有望占据生态链价值量核心 .................................................................................................................. 3 图表2:OpenAI与Google技术发展历程 ................................................................................................................. 4 图表3:Transformer架构拆解 ................................................................................................................................. 6 图表4:GPT、BERT的主要任务场景 ....................................................................................................................... 7 图表5:GPT-4支持多模态 ...................................................................................................................................... 7 图表6:PaLM-E机器人摄像头反馈 .......................................................................................................................... 7 图表7:LLaMA4个模型的基本信息 .......................................................................................................................... 8 图表8:LLaMA 与其他大模型Zero-shot性能对比 .................................................................................................... 8 图表9:AWS与Hugging Face合作创建了Hugging Face AWS深度学习容器(DLC) ................................................. 9 图表10:Hugging Face AWS优势 ........................................................................................................................... 9 图表11:Dojo与A100在经典图像分类模型ResNet-50下性能对比 ......................................................................... 10 图表12:Dojo与A100在自动标注和占用神经网络下性能对比 ................................................................................ 10 图表13:Anthropic各轮融资情况 .......................................................................................................................... 11 图表14:Anthropic已经发布类chatgpt产品claude................................................................................................ 11 图表15:Claude在部分任务上的响应速度极