您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[中泰证券]:Pinecone-向量数据库先行者 - 发现报告

Pinecone-向量数据库先行者

2023-08-03闻学臣中泰证券自***
Pinecone-向量数据库先行者

2 0 2 3.8.3 分析师:闻学臣执业证书编号:S0740519090007 向量数据库是什么? •向量数据库(Vector Database),也可称为矢量数据库,主要用途是存储和处理向量数据。有了向量数据库,我们就可以为人工智能添加高级功能,如语义信息检索、长期记忆等。下面这张图表让我们更好地了解向量数据库在此类应用中所扮演的角色: •首先,使用嵌入模型来生成向量嵌入,用于索引所需的内容。•将这些向量嵌入插入到向量数据库中,并与它们所对应的原始内容建立关联。•当应用程序发起查询时,我们使用相同的嵌入模型为查询生成嵌入,并利用这些嵌入在数据库中进行相似向量嵌入的查询。 资料来源:Pinecone公司官网、CSDN、中泰证券研究所 向量数据库与传统数据库的区别 •向量数据库是一种专门用来存储、管理和查询向量数据的数据库,其相较于传统关系型数据库主要有两点不同: •向量数据库存储的是向量数据,即将图片、音频、文章等非结构化数据转换为向量的方式来存储。通过将这些非结构化数据转化为向量,人工智能模型可以直接理解和处理数据。向量数据库能够更好地处理非结构化数据,并且提供更高效的数据访问和查询能力。 •向量数据库使用相似性搜索而不是传统数据库的准确匹配。传统数据库的查询结果通常是精确结果,而向量数据库会将输入的内容与数据库中的数据进行相似度匹配,以找出最相似的结果。这种相似性搜索的方式使得向量数据库在处理大规模数据集和高并发访问时能够保持高性能和高扩展性。与传统数据库相比,向量数据库能够更快地进行图像搜索、文本相似度匹配、语音识别等任务。 向量数据库的主要玩家 •目前市场上正在积极开发的多个向量数据库,主要包括Milvus、Pinecone、Vespa、Weaviate、Vald、Qdrant等。 •Milvus-自托管向量数据库、Pinecone-托管向量数据库、Vespa-托管/自托管向量数据库、Weaviate-托管/自托管向量数据库、Vald-自托管向量搜索引擎、Qdrant-托管/自托管向量搜索引擎和数据库。 资料来源:墨天轮、各公司官网、中泰证券研究所 Pinecone-公司介绍 •Pinecone成立于2019年,是向量数据库领域的早期探索者之一。Pinecone的创建是为了提供构建和运行最新AI应用程序所需的关键存储和检索基础架构。Gartner在2021年将Pinecone评为人工智能和机器学习数据领域的“Cool Vendor”。 •目前Pinecone是OpenAI的合作方,用户可以通过OpenAI的Embedding API生成语言嵌入,然后在Pinecone中为这些嵌入建立索引,以实现快速且可扩展的向量搜索。 Pinecone-公司管理团队 •CEO Edo Liberty,本科毕业于特拉维夫大学,并获得耶鲁大学计算机科学博士学位。曾任雅虎的技术总监,并负责管理AI实验室。随后在AWS带领Sagemaker的工作,并成为了亚马逊AI Lab的ReasearchHead。Edo Liberty是一位拥有深厚知识储备和丰富实践经验的管理者。 •Pinecone团队总人数超过50人,团队大多分布在工程方向。公司工程团队中有来自Google、Splunk、Databricks的工程师,其中21年底从Splunk加入的工程VP Ram Sriharsha,是整个团队的工程核心,在向量存储、产品Scaling相关的架构创新上做了很多工作。 Pinecone-发展历史 •Edo Liberty在亚马逊工作期间,敏锐地发觉embedding的增长需求,创建公司Hypercube.ai,主要从事基于深度学习的多媒体搜索解决方案;2021年,Hypercube.ai正式成为Pinecone。 图表:Pinecone发展历程 Pinecone-主要产品介绍以及盈利模式 •2021年1月,Pinecone正式宣布公开测试版产品。Pinecone提供了闭源、完全托管的云原生向量数据库,让使用者能够高效地存储和检索向量嵌入。•2021年9月,Pinecone 2.0发布,完全托管的向量数据库具有元数据过滤功能,可以更好地控制搜索结果,并提供了混合存储,最多可将成本降低10倍。•在2022年,因Pinecone最初的架构(C++和Python)性能出现瓶颈,团队决定使用Rust推倒重写,并优化性能。•从公司产品的发展脉络来看,Pinecone有着很清晰的规划,且极具创新性。 资料来源:Pinecone公司官网、中泰证券研究所 Pinecone-主要产品介绍以及盈利模式 •经过不断更新迭代的Pinecone,拥有运行成本低、完全托管等特点。 •Pinecone能够快速处理数十亿条向量数据,并实时更新索引;同时与元数据过滤器相结合,以获得更相关、更快速的结果。凭借自身产品的特点,Pinecone赢得多个客户青睐,在GCP和AWS Marketplace都上架了产品。 图表:Pinecone特点 资料来源:Pinecone公司官网、中泰证券研究所 Pinecone-主要产品介绍以及盈利模式 •Pinecone适用于广泛的应用程序: •语义文本搜索:使用像NLP转换器和句子嵌入模型将文本数据转换为向量嵌入,使用Pinecone索引和搜索。•生成问答:从Pinecone检索与查询相关的上下文,并将其传递给生成模型(OpenAI),以生成由真实数据来源支持的答案。•混合搜索:在一个查询中对数据执行语义和关键字搜索,并将结果组合以获得更相关的结果。•图像相似度搜索:将图像数据转换为向量嵌入,并使用Pinecone构建索引。 资料来源:Pinecone公司官网、CSDN、中泰证券研究所 Pinecone-主要产品介绍以及盈利模式 •目前Pinecone的定价模型主要分为三种,分别为:Starter、Standard、Enterprise。 •Starter:免费版,用于试用和小型应用,仅支持创建单个项目;•Standard:每月70美元起,适用于任何规模的生产应用,支持自由索引•Enterprise:每月104美元起,适用于任务关键型生产应用,支持Standard所有功能且提供24/7/365专属支持。 Pinecone-经营数据 •截至2022年12月31日,Pinecone付费客户超过200名,其中包括Workday、Xandr(Microsoft)、Gong、Course Hero、BambooHR、Expel和Zapier等等。•Pinecone目前使用数量正在快速上升,根据公司官网的新闻(2023.4)的数据显示,Pinecone的免费计划每天有超过1万个注册,并且增长迅速。•根据Growjo的数据显示:Pinecone估计年收入目前为7.1百万美元,估值为7.5亿美元(2023年4月)。 图表:Pinecone用户数情况 资料来源:Pinecone公司官网、中泰证券研究所 Pinecone-融资情况 •目前Pinecone共获得3轮融资,三轮融资总额达到1.38亿美元。•种子轮融资(2021.1):获融资1000万美元;•A轮融资(2022.3):获融资2800万美元;•B轮融资(2023.4):获融资1亿美元。 Pinecone-未来规划 •Pinecone团队肩负着建立搜索和数据库技术的使命,让Pinecone的产品能够为下一波人工智能驱动的创新提供动力。•公司将进一步与Shopify、Gong和Zapier等公司合作,并计划利用新资金进行招聘,逐步扩大团队。 图表:Pinecone 风险提示 ◼研究报告使用的公开资料可能存在信息滞后或更新不及时的风险。◼技术落地不及预期、竞争加剧等 重要声明 ◼中泰证券股份有限公司(以下简称“本公司”)具有中国证券监督管理委员会许可的证券投资咨询业务资格。本报告仅供本公司的客户使用。本公司不会因接收人收到本报告而视其为客户。 ◼本报告基于本公司及其研究人员认为可信的公开资料或实地调研资料,反映了作者的研究观点,力求独立、客观和公正,结论不受任何第三方的授意或影响。本公司力求但不保证这些信息的准确性和完整性,且本报告中的资料、意见、预测均反映报告初次公开发布时的判断,可能会随时调整。本公司对本报告所含信息可在不发出通知的情形下做出修改,投资者应当自行关注相应的更新或修改。本报告所载的资料、工具、意见、信息及推测只提供给客户作参考之用,不构成任何投资、法律、会计或税务的最终操作建议,本公司不就报告中的内容对最终操作建议做出任何担保。本报告中所指的投资及服务可能不适合个别客户,不构成客户私人咨询建议。 ◼市场有风险,投资需谨慎。在任何情况下,本公司不对任何人因使用本报告中的任何内容所引致的任何损失负任何责任。 ◼投资者应注意,在法律允许的情况下,本公司及其本公司的关联机构可能会持有报告中涉及的公司所发行的证券并进行交易,并可能为这些公司正在提供或争取提供投资银行、财务顾问和金融产品等各种金融服务。本公司及其本公司的关联机构或个人可能在本报告公开发布之前已经使用或了解其中的信息。 ◼本报告版权归“中泰证券股份有限公司”所有。事先未经本公司书面授权,任何机构和个人,不得对本报告进行任何形式的翻版、发布、复制、转载、刊登、篡改,且不得对本报告进行有悖原意的删节或修改。