您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[安信证券]:谷歌i、O大会、AI虚拟人、向量数据库浅析 - 发现报告
当前位置:首页/行业研究/报告详情/

谷歌i、O大会、AI虚拟人、向量数据库浅析

信息技术2023-05-15赵阳、夏瀛韬安信证券从***
谷歌i、O大会、AI虚拟人、向量数据库浅析

谷歌I/O大会召开,关注模型小型化和AI安全监管 5月11日,一年一度的谷歌I/O开发者大会召开,生成式AI成为此次大会的重点,包括:新一代语言模型PaLM 2;AI聊天机器人Bard; 谷歌生成式AI实验版搜索引擎;Workspace对标微软Office全家桶,让AI写邮件、画图、制表、代写文稿;生成式AI协作工具Duet AI提供代码辅助和聊天辅助功能;推出基于NVIDIA H100 GPU的A3新实例;通过构建评估工具、增加水印和元数据等方式检测AI生成内容;安卓增加由生成式AI驱动的信息回复、生成式AI壁纸功能等。我们认为核心亮点在于两方面: 1)大模型小型化,移动端有望兴起:此次谷歌推出的新一代语言模型PaLM 2分为四种规格,其中Gecko非常轻量级,可在移动设备上工作,并且速度足够快,即便在离线情况下也能在设备上运行出色的交互式应用程序。我们认为大模型的小型化、本地化将会成为未来的重要产业趋势,一方面实现模型的成本降低,另一方面实现数据的隐私保护。未来大模型有望在移动端更多部署,从而促进产业向万物互联时代迈进。关注在移动终端方面具备AI业务布局的企业如中科创达、虹软科技、当虹科技等。 2)AI安全监管:为了识别出AI生成内容,谷歌计划很快将水印、元数据及其他技术创新集成到最新的生成模型中。谷歌还训练了一个检测合成音频的分类器,准确率接近99%。我们认为随着生成式AI的发展,如何判别内容的真伪将成为一个增量的新需求,关注AI安全监管和内容判别类的公司美亚柏科等。 AI虚拟人兴起,有望成为生成式AI的重要应用场景 近期,有关AI虚拟人的相关事件关注度持续提升:1)AI孙燕姿全网走红:在B站上,AI孙燕姿翻唱的林俊杰「她说」、周董「爱在西元前」、赵雷「成都」等等较为逼真,引发全网的关注。2)美国女网红用AI分身交友,实现按分钟计费:根据新智元的报道,23岁的女网红用GPT-4复刻了一个自己后,已经周入7万多美元。这位叫做Caryn Marjorie的网红,根据自己2000个小时的YouTube视频,训练出了一个语音聊天机器人,AKA「虚拟女友」。 我们认为,近期网上对AI虚拟人的关注度持续提升,也出现了一定程度上的产品和商业模式落地。AI虚拟人将会成为未来AI和元宇宙结合的直接应用,也将从根本上改变人与人之间的关系,提升全社会的生产效率,创造更大的应用价值。关注在AI虚拟人方面有业务布局的算法和产品类企业如科大讯飞、万兴科技、拓尔思等。 向量数据库是大模型时代的刚需,前景广阔 4月以来,全球多家向量数据库创业公司密集获得新一轮融资。其中,Pinecone完成1亿美元B轮融资(投后估值7.5亿美元),Weaviate完成5000万美元B轮融资,Chroma获1800万美元种子轮融资,Qdrant获750万美元种子融资。 向量数据库是一种专门用来存储、管理和查询向量数据的数据库,其相较于传统关系型数据库主要有两点不同:1)存储的是向量数据,即将图片、音频、文章等非结构化数据转换为向量的方式来存储,以便于计算机或者AI模型直接理解。2)使用相似性查找,不同于传统数据库的查询结果是一个精确的结果,向量数据库会把输入的内容与底库中的数据做相似度匹配,从而找出近似匹配的结果。 得益于上述特性,向量数据库先前多被运用于以图搜图、推荐算法等领域,但随着生成式AI的出现,其使用场景几何级拓宽,具体包括: 1)帮助用户管理私域数据,既可以是B端垂直领域的专业知识,也可以是C端用户的画像信息;2)为大模型提供记忆功能,典型应用如AutoGPT就采用了OpenAI(模型)+Pinecone(向量数据库)的模式。3)降低大模型的训练和推理成本,如将常见的问答存入向量数据库,对于相似的问题直接生成答案,减少推理需求。我们认为,生成式AI的出现让向量数据库迎来killer app时刻,随着各类基于大模型的上层应用出现,预计向量数据库的使用量将出现跨越式发展,有望复刻移动互联网时代MongoDB的兴起。关注:星环科技、拓尔思、大华股份、达梦数据、太极股份、创意信息等。 建议关注 基础工具:普源精电-U、鼎阳科技、坤恒顺维、霍莱沃、概伦电子、华大九天。 智能汽车:德赛西威、中科创达、四维图新、道通科技、虹软科技、万集科技。 工业软件:宝信软件、中望软件、中控技术、赛意信息、能科科技、鼎捷软件。 数字能源:朗新科技、国能日新、南网科技、龙软科技、国网信通、远光软件。 人工智能:科大讯飞、海康威视、大华股份、奥普特、商汤-W、寒武纪。 网络安全:深信服、安恒信息、启明星辰、天融信、奇安信-U、信安世纪。 风险提示 1)疫情加剧降低企业信息化支出;2)财政与货币政策低于预期;3)供应链波动加大,影响科技产业发展。 1.本周行业观点 谷歌I/O大会召开,关注模型小型化和AI安全监管 5月11日,一年一度的谷歌I/O开发者大会召开,生成式AI成为此次大会的重点,包括:新一代语言模型PaLM 2;AI聊天机器人Bard;谷歌生成式AI实验版搜索引擎;Workspace对标微软Office全家桶,让AI写邮件、画图、制表、代写文稿;生成式AI协作工具Duet AI提供代码辅助和聊天辅助功能;推出基于NVIDIA H100 GPU的A3新实例;通过构建评估工具、增加水印和元数据等方式检测AI生成内容;安卓增加由生成式AI驱动的信息回复、生成式AI壁纸功能等。我们认为核心亮点在于两方面: 1)大模型小型化,移动端有望兴起:此次谷歌推出的新一代语言模型PaLM 2分为四种规格,其中Gecko非常轻量级,可在移动设备上工作,并且速度足够快,即便在离线情况下也能在设备上运行出色的交互式应用程序。我们认为大模型的小型化、本地化将会成为未来的重要产业趋势,一方面实现模型的成本降低,另一方面实现数据的隐私保护。未来大模型有望在移动端更多部署,从而促进产业向万物互联时代迈进。关注在移动终端方面具备AI业务布局的企业如中科创达、虹软科技、当虹科技等。 2)AI安全监管:为了识别出AI生成内容,谷歌计划很快将水印、元数据及其他技术创新集成到最新的生成模型中。谷歌还训练了一个检测合成音频的分类器,准确率接近99%。我们认为随着生成式AI的发展,如何判别内容的真伪将成为一个增量的新需求,关注AI安全监管和内容判别类的公司美亚柏科等。 AI虚拟人兴起,有望成为生成式AI的重要应用场景 近期,有关AI虚拟人的相关事件关注度持续提升:1)AI孙燕姿全网走红:在B站上,AI孙燕姿翻唱的林俊杰「她说」、周董「爱在西元前」、赵雷「成都」等等较为逼真,引发全网的关注。2)美国女网红用AI分身交友,实现按分钟计费:根据新智元的报道,23岁的女网红用GPT-4复刻了一个自己后,已经周入7万多美元。这位叫做Caryn Marjorie的网红,根据自己2000个小时的YouTube视频,训练出了一个语音聊天机器人,AKA「虚拟女友」。 我们认为,近期网上对AI虚拟人的关注度持续提升,也出现了一定程度上的产品和商业模式落地。AI虚拟人将会成为未来AI和元宇宙结合的直接应用,也将从根本上改变人与人之间的关系,提升全社会的生产效率,创造更大的应用价值。关注在AI虚拟人方面有业务布局的算法和产品类企业如科大讯飞、万兴科技、拓尔思等。 向量数据库是大模型时代的刚需,前景广阔 4月以来,全球多家向量数据库创业公司密集获得新一轮融资。其中,Pinecone完成1亿美元B轮融资(投后估值7.5亿美元),Weaviate完成5000万美元B轮融资,Chroma获1800万美元种子轮融资,Qdrant获750万美元种子融资。 向量数据库是一种专门用来存储、管理和查询向量数据的数据库,其相较于传统关系型数据库主要有两点不同:1)存储的是向量数据,即将图片、音频、文章等非结构化数据转换为向量的方式来存储,以便于计算机或者AI模型直接理解。2)使用相似性查找,不同于传统数据库的查询结果是一个精确的结果,向量数据库会把输入的内容与底库中的数据做相似度匹配,从而找出近似匹配的结果。 得益于上述特性,向量数据库先前多被运用于以图搜图、推荐算法等领域,但随着生成式AI的出现,其使用场景几何级拓宽,具体包括:1)帮助用户管理私域数据,既可以是B端垂直领域的专业知识,也可以是C端用户的画像信息;2)为大模型提供记忆功能,典型应用如AutoGPT就采用了OpenAI(模型)+ Pinecone(向量数据库)的模式。3)降低大模型的训练和推理成本,如将常见的问答存入向量数据库,对于相似的问题直接生成答案,减少推理需求。我们认为,生成式AI的出现让向量数据库迎来killerapp时刻,随着各类基于大模型的上层应用出现,预计向量数据库的使用量将出现跨越式发展,有望复刻移动互联网时代MongoDB的兴起。关注:星环科技、拓尔思、大华股份、达梦数据、太极股份、创意信息等。 图1.本周各行业涨跌幅统计 3.重要行业新闻 3.1.AI大数据应用 5月10日周三举行的谷歌年度开发者大会Google I/O 2023上,谷歌正式发布新的通用大语言模型PaLM 2。PaLM 2是驱动AI机器人Bard的模型的升级版,可以生成多种文本回应用户。谷歌称,它可以使用100种语言,擅长数学、软件开发、语言翻译推理和自然语言生成。同时,谷歌发布,旗下产品广泛应用AI技术的功能,从文档等各种协作工具、到电邮、搜索、云等各种服务一网打尽,让新型大模型支持的AI功能在各种产品中全面结合。谷歌还发布了两款手机,其中包括首次推出的可折叠手机Pixel Fold,同时开始预售新款平板电脑Pixel。谷歌确认,新版智能手表Wear OS 4将在今年晚些时候面世,同时会有一批Wear OS配套App和功能出炉。(来源:华尔街见闻) 5月13日,OpenAI宣布将在下周向所有Chatgpt Plus用户开放联网功能和众多插件,允许Chatgpt防伪互联网并使用70多个第三方插件。2个月前,OpenAI宣布推出Plugins插件功能,赋予Chatgpt使用工具、联网、运行计算的能力,当时需要申请加入候补名单才能使用,现在已经扩大至所有Chatgpt Plus用户。(来源:OpenAI) Meta公司发布了一个新的开源人工智能模型ImageBind,该模型能够将多种数据流,包括文本、音频、视觉数据、温度和运动读数等整合在一起。该模型目前只是一个研究项目,还没有直接的消费者或实际应用,但它展示了未来生成式人工智能系统的可能性,这些系统能够创造出沉浸式、多感官的体验。(来源:IT之家) 根据SimilarWeb统计,ChatGPT 4月份全球访问量再创新高,达到17.6亿次,已超越必应等其他国际搜索引擎,并达到谷歌的2%,百度的60%。目前排在其前面的除了谷歌,只剩下中国的百度和俄罗斯的Yandex。(来源:SimilarWeb) 3.2.数字金融 近日,法国巴黎银行(中国)宣布将与中国银行—中电联运营机构合作推广数字人民币钱包的银行间业务场景。法国巴黎银行(中国)官方微信公众号披露,通过本次合作,法国巴黎银行(中国)将与中国银行进行系统对接,开展直连业务合作,上线对公钱包等围绕数字人民币的一系列基本功能,满足企业数字人民币支付等业务需求。(来源:中国经营报) 3.3.智能网联汽车 据中汽协官网,截至2023年1月底,不满足实际行驶污染物排放试验(即RDE试验)要求的库存车辆超过189万,含已采购部件的库存超过200万。对于积压的原因,中汽协认为有以下四点:一是汽车市场表现不及预期。二是产品生产切换需要一定时间。三是新能源汽车抢占部分传统燃油车市场。四是部分地区降价行为加剧消费者持币待购。(来源:36氪) 近日,滴滴自动驾驶公司与广汽埃安新能源汽车股份有限公司签署深化合作协议,共同发布无人驾驶新能源量产车项目——“AIDI计划”,并宣布成立合资公司。据了解,首款量产车型将基于广汽埃安AEP3.0高端