您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[中泰证券]:人工智能行业双周报:Google发布Gemini大模型,多模态应用或加速落地 - 发现报告
当前位置:首页/行业研究/报告详情/

人工智能行业双周报:Google发布Gemini大模型,多模态应用或加速落地

人工智能行业双周报:Google发布Gemini大模型,多模态应用或加速落地

12月6日,Google正式发布了Gemini 1.0,并声称这是多模态任务处理能力首次超越人类的AI模型。Gemini共有三个版本,Gemini Ultra是谷歌最大、最强模型,适用于高度复杂的任务;Gemini Pro是可扩展至各种任务的Gemini模型;Gemini Nano是适用于端侧设备的模型。在被大型语言模型(LLM)研究和开发中广泛使用的32项学术基准中,Gemini Ultra的性能有30项都超过了目前最先进的水平。 Pika Labs日前发布了其首款视频生成产品Pika1.0。据其介绍,Pika1.0能够生成和编辑3D动画、动漫、卡通和电影,效果可媲美Runway的Gen产品。Pika1.0目前正在内测中,还未正式上线,目前还需要等待才能获得体验机会。 投资建议:人工智能新一轮十年级的技术和产业革命大幕已经拉开,短期调整并不影响产业的长期投资机会,当前海外已经开始进入商业落地阶段,ChatGPT、Midjourney等现象级爆品出现,微软、Adobe、Salesforce、Zoom等软件巨头亦纷纷推出商业化产品,静待数据的持续验证;国内短期看算力最确定,模型训练拉动训练算力需求,未来应用大规模兴起亦会拉动推理算力需求。大模型仍处于群雄逐鹿、快速迭代阶段,未来空间大且会格局收敛,应用端长期空间最大,厂商百花齐放。 算力:服务器建议关注浪潮信息、中科曙光、紫光股份等,芯片建议关注英伟达、寒武纪、海光信息、龙芯中科等; 模型:国内建议关注科大讯飞、百度、商汤、三六零、格灵深瞳、云从科技、云天励飞等;海外建议关注微软、Meta、谷歌、特斯拉等; 生态链:数据建议关注星环科技、海天瑞声等,安全建议关注深信服、启明星辰、安恒信息、天融信、绿盟科技、迪普科技、安博通、奇安信、永信至诚、美亚柏科等; 应用:生产力工具建议关注金山办公、万兴科技、广联达、中望软件、彩讯股份、福昕软件等;ERP等办公场景建议关注金蝶国际、明源云、鼎捷软件、用友网络、致远互联等;金融场景建议关注恒生电子、同花顺、中科软、宇信科技等;汽车场景建议关注中科创达、德赛西威、经纬恒润、万集科技等;医疗场景建议关注卫宁健康、创业慧康、嘉和美康、医渡科技、鹰瞳科技等;其他建议关注焦点科技、中科星图、航天宏图、拓尔思、佳发教育、神思电子等。 风险提示:AI技术落地不及预期、产品市场竞争加剧、数据更新不及时等 重点标的公司跟踪 市场整体涨跌幅情况 近两周涨跌幅情况:近两周【上证综指】涨跌幅-2.35%,【沪深300】涨跌幅-3.92%,【深证成指】涨跌幅-2.9%,【创业板指】涨跌幅-2.36%,【计算机(申万)】涨跌幅0.97%。 年初至今涨跌幅情况:年初至今【上证综指】涨跌幅-3.87%,【沪深300】涨跌幅-12.2%,【深证成指】涨跌幅-13.27%,【创业板指】涨跌幅-19.37%,【计算机(申万)】涨跌幅14.3%。 图表1:市场涨跌幅情况 人工智能重点关注公司涨跌幅情况 图表2:重点关注人工智能股票池涨跌幅情况 政策与前沿进展 欧盟就全球首部全面监管AI的《人工智能法案》达成协议 已达成协议的《人工智能法案》草案规定,严格禁止“对人类安全造成不可接受风险的人工智能系统”,其中包括有目的地操纵技术、利用人性弱点或根据行为、社会地位和个人特征等进行评价的系统等。 相关规定还包括,人工智能公司要对其算法进行人为控制,提供技术文件,并为“高风险”应用建立风险管理系统。每个欧盟成员国都将设立一个监督机构,确保这些规则得到遵守。 新闻链接: 代表性AI产品数据跟踪 ChatGPT11月份访问量基本持平 2023年11月,ChatGPT月度访问量为17亿次,与上月大体持平。主要原因可能是GPTs上线后网站出现了崩溃,以及官方限制Plus用户订阅等因素。 图表3:ChatGPT月度访问量(次) Claude.ai月度访问量达2 5.9M 次 Claude是由人工智能初创公司Anthropic发布的一款聊天机器人。2023年11月,Claude.ai网站访问量达到2 5.9M ,较上月有所提升。 图表4:Claude.ai月度访问量(次) Pi.ai月度访问量达3. 9M 次 Pi是由人工智能初创公司inflectionAI发布的聊天机器人。2023年11月,pi.ai网站访问量达3. 9M ,较10月有较大提升。 图表5:Pi.ai月度访问量(次) Character.ai月度访问量维持稳定 Character.ai是由谷歌对话编程语言模型(LaMDA)的前开发者Noam Shazeer和Daniel De Freitas共同开发的一款对话程序。2023年11月,Character.ai网站访问量162. 6M ,与上月基本持平。 图表6:Character.ai月度访问量(次) Perplexity.ai月度访问量持续上升,11月达 52.7M 次 Perplexity是一个具有人工智能聊天机器人界面的初创搜索引擎。2023年11月,perplexity.ai访问量达 52.7M ,较10月维持较大幅度的增长。 图表7:Perplexity.ai访问量(次) Bing.com月度访问量维持13亿次 2023年11月,搜索引擎网站bing.com访问量维持在13亿次左右。 图表8:Bing.com月度访问量(次) Google.bard.com月度访问量微增 2023年11月,Google对话网站google.bard.com访问量为26 8.8M 次。 图表9:Bard月度访问量(次) AI领域投融资事件跟踪 开源类ChatGPT平台Mistral AI,再获4.5亿欧元融资 开源类ChatGPT平台Mistral AI获得4.5亿欧元(近35亿元)融资,估值近20亿美元(142亿元)。本次由英伟达、Salesforce等投资。 Mistral AI的开源大语言模型Mistral 7B主打参数小、能耗低、性能强等特点,并且允许商业化。支持生成文本/代码、数据微调、总结内容等,目前在github有4500颗星。 值得一提的是,Mistral AI曾在没有发布任何产品的情况下,获得1.13亿美元种子轮融资,这也是欧洲科技史上最大的种子轮融资之一。 新闻链接:https://www.sohu.com/a/741753503_104036 AI软件和存储初创公司Vast Data完成1.18亿美元E轮融资 人工智能软件和存储初创公司Vast Data宣布完成1.18亿美元E轮融资,由富达投资(Fidelity Ventures)领投,New Enterprise Associates、BOND Capital、Drive Capital、英伟达、戴尔、高盛、Tiger Global、Commonfund、Norwest、83 North、Greenfield和Next47等公司参投。 在此轮融资后,Vast的融资总额为3.81亿美元,其估值达到了91亿美元。 Vast联合创始人兼首席执行官Renen Hallak表示,人们对人工智能的兴趣激增,以及对能够支持这些工作负载的现代基础设施的需求,有利于Vast的业务发展,使公司能够持续增长,并被企业采用。” Hallak于2016年与Jeff Denworth、Shachar Fienblit( 曾在Kaminario和IBM担任领导职务)和Alon Horev(曾在思科和IBM担任领导职务)共同创立了Vast,该平台利用商用硬件为人工智能工作负载提供对更大数据集的快速访问。 新闻链接:https://new.qq.com/rain/a/20231208A05I0900 开源生成式AI初创平台together.ai,获7.3亿元融资 11月30日,开源生成式AI平台Together AI在官网宣布,获得1.025亿美元(约7.3亿元)A轮融资。本次由凯鹏华盈(Kleiner Perkins)领投,英伟达、Emergence Capital、NEA、Prosperity 7、Greycroft等跟投。 Together AI创立于2022年6月,总部位于美国旧金山硅谷。曾在今年5月15日获得2000万美元种子轮融资,是大模型开源领域发展非常快的一家企业。产品方面,Together AI坚信开源才是大模型的未来,自成立以来便发布了多个受到企业、开发者好评的开源产品。 其产品分别是类ChatGPT开源模型RedPajama-INCITE,开源30万亿训练数据集RedPajama-Data-v2,开源大语言模型训练、推理加速器FlashAttention v2。 新闻链接:https://finance.sina.com.cn/blockchain/2023-11-30/doc-imzwkmit4695100.shtml 海内外AI公司新品追踪 Google发布Gemini多模态大模型 12月6日,Google正式发布了Gemini1.0,并号称这是多模态任务处理能力首次超越人类的AI模型。Gemini共有三个版本: Gemini Ultra:谷歌最大、最强模型,适用于高度复杂的任务Gemini Pro:可扩展至各种任务的Gemini模型 Gemini Nano:适用于端侧设备的模型 从自然图像、音频和视频理解到数学推理,在被大型语言模型(LLM)研究和开发中广泛使用的32项学术基准中,Gemini Ultra的性能有30项都超过了目前最先进的水平。在多模态方面,GeminiUltra在新的MMMU基准测试中也获得了59.4%的SOTA分数。 以往创建多模态大模型的方法,通常是为不同的模态训练单独的组件,然后将它们拼接在一起,大致模拟其中的一些功能。这样训练出来的模型虽然有时可以很好地执行某些任务(比如描述图像),但在面对更具概念性和复杂推理的情况下,就会出现表现不佳的结果。 相比较下的谷歌Gemini强调的原生多模态,是指从一开始就对不同的模态进行预训练,然后用额外的多模态数据对其进行微调,以此来进一步完善大模型的有效性。谷歌对此表示:这样的训练方法,有助于Gemini从头开始无缝地理解和推理各种输入,远远优于现有的多模态模型;而且它的功能在几乎每个领域都是最先进的。 具体到模型架构方面,Gemini基于增强的Transformer decoder打造,采用了高效attention机制(如Multi-QueryAttention),支持32k上下文长度。尽管没有透露Ultra和Pro版本的具体参数规模,但技术报告中提到,谷歌使用TPUv5e和TPUv4来训练Gemini。训练Gemini Ultra使用了跨多个数据中心的大量TPUv4。这意味着与谷歌此前的主力大模型PaLM-2相比,Gemini在规模上显著增大。此前,PaLM-2被曝参数规模为3400亿。 新闻链接:https://new.qq.com/rain/a/20231207A06QI000 Pika Labs发布首款视频生成产品Pika1.0 美国AI初创公司Pika Labs日前发布了其首款视频生成产品Pika1.0。 据其介绍,Pika1.0能够生成和编辑3D动画、动漫、卡通和电影。。 Pika Labs的投资人阵容不容小觑,OpenAI两位创始成员亚当·迪安杰罗、安德烈·卡帕西都在其中。Github前CEO纳特·弗里德曼、HuggingFace创始人克莱门特·德朗格、Giphy联合创始人Alex Chung、YC合伙人丹尼尔·格罗斯、硅谷著名投资人埃拉德·吉尔等也出现在投资人阵营中,几乎是硅谷AI行业的半壁江山。 Pika1.0目前正在内测中,还未正式上线,目前还需要等待才能获得体验机会。根据介绍,作为一款文生视频工具,Pika1.0的主要功能包括:输入文字即可快速生成时长3秒的视频,对现有视频的背景、其