行业研究|动态跟踪 看好(维持) 他山之石系列报告(五):Snowflake基于云数据平台发展“AI+数据”模式 计算机行业 国家/地区中国 行业计算机行业 报告发布日期2023年08月24日 核心观点 Snowflake是一种基于云的数据平台,为组织提供存储、管理和分析大量结构化和半结构化数据的能力。它旨在通过提供高度可扩展和灵活的架构来实现解决传统数据仓库和分析解决方案所面临的挑战,具备物理上分离但逻辑集成的存储、计算和 全局服务层。其底层采用了集中式存储,中间的多集群计算层与存储层完全分离,可根据每个工作负载的独立需求来调整计算资源的大小,顶层的云服务可以提供和管理多种服务,具备高度的可扩展性。在过去的几年里,Snowflake经历了惊人的增长,营业收入从19财年的不到1亿美元增长到23财年超过20.6亿美元,年复合增长率超过115%。 Snowflake在数据仓库领域市占率领先。持续的高营业额增长背后是Snowflake从 Teradata、甲骨文、IBM和EMC等传统企业手中夺取的市场份额。根据6sense的最新统计,按照客户数量的口径,Snowflake在数据仓库市场占有率排名第一,达到19.14%。截至2023年4月30日,Snowflake数据云平台在全球拥有超过 8,000家客户,客户可以利用数据云平台大规模地构建并共享领先的数据应用。目前Snowflake正在向AI发展靠拢,呈现“数据库+AI”的模式,有望成为机器学习和数据分析最相关的云平台。 Snowflake提前进行AI领域布局,通过并购后与行业巨头合作的方式推进AI战略。自2022年以来,Snowflake开始布局“数据+AI”模式,共先后并购六家相关公司,包括Streamlit,Applica,SnowConvert,Myst.AI,LeapYear,和Neeva。 另外,Snowflake也积极和行业巨头开展合作,包括微软和英伟达等公司。 2023年Snowflake峰会彰显公司在生成式AI领域的战略决心。6月26日-29日, Snowflake召开了2023年度峰会,会议围绕“数据、Apps、AI”主题,展现了公司对于生成式AI技术的大力投入。除了邀请到NVIDIA的CEO黄仁勋亲临现场宣布达成合作外,在峰会上,Snowflake推出了多款生成式AI工具,包括Snowpark容器服务和DocumentAI。 生成式AI浪潮的兴起引领了数据平台厂商的新方向。考虑到数据在生成式AI时代所处的关键地位,各大数据基础软件平台厂商对生成式AI带来的机会也十分重视, 像Snowflake、Databricks、星环科技等国内外典型数据基础软件厂商都在大力发展生成式AI,将其产品从数据基础设施层向AI应用与开发层延伸。其逻辑都是在基于其数据平台的基础上,增加生成式AI应用开发、LLMOps、AI/ML工作流、向量数据库等生成式AI所需的工具产品,为开发人员和工作人员提供更智能、更高效的数 证券分析师浦俊懿 021-63325888*6106 pujunyi@orientsec.com.cn 执业证书编号:S0860514050004 证券分析师陈超 021-63325888*3144 chenchao3@orientsec.com.cn 执业证书编号:S0860521050002 证券分析师谢忱 xiechen@orientsec.com.cn 执业证书编号:S0860522090004 联系人杜云飞 duyunfei@orientsec.com.cn 联系人覃俊宁 qinjunning@orientsec.com.cn 联系人宋鑫宇 songxinyu@orientsec.com.cn 据平台,帮助用户快速构建生成式AI应用。此外,一些深耕垂直行业的数据基础软件厂商更是在自身积累数据的基础上,推出自研垂类大模型,进一步完善“AI+数据”的能力,将自身的数据能力更好地对外赋能。 投资建议与投资标的 我们认为,数据是人工智能大模型能力的基础,具备大量数据积累的数据平台厂商和深耕垂直领域的厂商有望在生成式AI的浪潮中持续受益。建议关注星环科技-U(688031,未评级)、新致软件(688590,未评级)等公司。 风险提示 技术落地不及预期;政策监管风险 他山之石系列报告(四):Cohere专注自然语言处理,降低企业应用AI风险 他山之石系列报告(三):Adobe大力发展生成式AI应用 他山之石系列报告(二):大模型应用开发框架LangChain梳理 他山之石系列报告(一):Salesforce的大模型ToB应用分析 2023-07-24 2023-07-18 2023-07-16 2023-07-05 有关分析师的申明,见本报告最后部分。其他重要信息披露见分析师申明之后部分,或请与您的投资代表联系。并请阅读本证券研究报告最后一页的免责申明。 目录 一、Snowflake:云数据平台高速发展,加强AI领域布局4 1.1市场领先的云数据平台,生态圈发展完善4 1.2提前进行“数据+AI”布局,并购与合作双管齐下6 二、AI+数据相辅相成,数据厂商打造AI时代新平台8 投资建议与投资标的10 风险提示10 图表目录 图1:Snowflake架构4 图2:Snowflake近5财年营业收入(单位:亿美元)4 图3:2023年数据仓库领域市占率情况(客户数口径)4 图4:Gartner预测2026年数据云平台市场规模4 图5:Snowflake生态圈5 图6:Snowflake各行业客户案例5 图7:SnowflakeM&A时间线7 图8:SnowflakeAI生态圈7 图9:Snowpark容器服务8 图10:DocumentAI8 图11:全球向量数据库市场空间(单位:亿美元)9 图12:全球MLOps市场空间(单位:亿美元)9 图13:星环科技-企业自有大模型应用构建流程图9 图14:星环科技无涯金融大模型9 表1:Snowflake并购时间线7 一、Snowflake:云数据平台高速发展,加强AI领域布局 1.1市场领先的云数据平台,生态圈发展完善 Snowflake是一种基于云的数据平台,为组织提供存储、管理和分析大量结构化和半结构化数据的能力。它旨在通过提供高度可扩展和灵活的架构来实现解决传统数据仓库和分析解决方案所面临的挑战,具备物理上分离但逻辑集成的存储、计算和全局服务层。其底层采用了集中式存储,中间的多集群计算层与存储层完全分离,可根据每个工作负载的独立需求来调整计算资源的大小,顶层的云服务可以提供和管理多种服务,具备高度的可扩展性。Snowflake最初于2014年在 AWS上构建了他们基于云的仓库,然后开始构建他们的平台和应用程序来运行数据仓库以外的工作负载。在过去的几年里,Snowflake经历了惊人的增长,营业收入从19财年的不到1亿美元增 长到23财年超过20.6亿美元,年复合增长率超过115%。 图1:Snowflake架构图2:Snowflake近5财年营业收入(单位:亿美元) 营业收入(亿美元)增速 25 20 15 10 5 0 FY2019FY2020FY2021FY2022FY2023 200% 150% 100% 50% 0% 数据来源:Snowflake,东方证券研究所数据来源:wind,东方证券研究所 Snowflake在数据仓库领域市占率领先。持续的高营业额增长背后是Snowflake从Teradata、甲骨文、IBM和EMC等传统企业手中夺取的市场份额。根据6sense的最新统计,按照客户数量的 口径,Snowflake在数据仓库市场占有率排名第一,达到19.14%。根据Gartner的预测,到2026 年,云数据平台的行业规模将达到2480亿美元。截至2023年4月30日,Snowflake数据云平 台在全球拥有超过8,000家客户,并致力于助力企业实现企业内部以及与客户、合作伙伴、供应商和其他各方的数据统一、整合、分析和共享。此外,客户还可以利用数据云平台大规模地构建并共享领先的数据应用。目前Snowflake正在向AI发展靠拢,呈现“数据库+AI”的模式,有望成为机器学习和数据分析最相关的云平台。 图3:2023年数据仓库领域市占率情况(客户数口径)图4:Gartner预测2026年数据云平台市场规模 25.41% 19.14% 17.43% 10.83% 13.15%14.04% SnowflakeAmazonRedshift SAPBusinessWarehouse GoogleBigQuery OracleDataWarehousing Others 数据来源:6sense,东方证券研究所数据来源:Snowflake,Gartner,东方证券研究所 Snowflake生态发展完善,云数据平台覆盖多个行业领域。Snowflake将生态合作伙伴分为数据集成、商业智能、机器学习与数据科学、安全管理、SQL开发和管理和原生程序接口六大类,共 100余个合作伙伴。Snowflake基于其统一的云数据平台提供针对特定行业的解决方案,帮助提供跨多个垂直行业和业务线的创新解决方案,包括广告、媒体娱乐、金融服务、医疗和生命科学、制造业、零售和包装消费品、科技、电信以及政府等行业。 图5:Snowflake生态圈 数据来源:Snowflake,东方证券研究所 图6:Snowflake各行业客户案例 数据来源:Snowflake,东方证券研究所 1.2提前进行“数据+AI”布局,并购与合作双管齐下 Snowflake提前进行AI领域布局,通过并购后与行业巨头合作的方式推进AI战略。自2022年以来,Snowflake开始布局“数据+AI”模式,共先后并购六家相关公司,包括Streamlit,Applica,SnowConvert,Myst.AI,LeapYear,和Neeva。另外,Snowflake也积极和行业巨头开展合作,包括微软和英伟达等公司。 1)Applica——文档自动化处理 2022年8月,Snowflake收购了波兰AI公司Applica。收购价格虽然没有正式公开披露,但有关方面预估收购价达到了1.7亿美元。Applica是一款先进的文档自动化解决方案,利用前沿的深度学习技术处理各种类型的文档,包括无结构、半结构和结构化格式。通过像人类一样理解内容,它提供了直通式自动化速率,显著增强了操作效率,帮助企业加快了销售周期,减少了人为错误。Applica拥有面向企业用户的易用界面,与现有系统无缝集成,并可在任何环境下使用,并且不要求用户拥有编程能力,可以直接用自然语言快速下达指令。 2)Neeva——基于生成式AI技术的搜索服务 2023年5月24日,Snowflake以1.5亿美元的价格收购Neeva.ai。Neeva是由两名前谷歌员工成立的搜索初创公司,公司一直致力于提供搜索服务,既有消费者端服务也有企业级产品。Neeva在搜索中利用生成式AI的能力是吸引Snowflake的原因之一。今年1月,该公司推出了NeevaAI,通过生成式AI技术回答使用者的问题。被收购后,Neeva宣布放弃消费者搜索业务,将专注于企业业务。 3)Myst.AI——时间序列预测工具 2023年1月,Snowflake以非公开价格收购了加州AI公司Myst.AI。Myst是专业的时间序列预测工具,赋予团队创建、部署和维护准确预测模型的能力。它提供用户友好的模型结构可视化,可以快速访问第三方数据,并支持流行的开源机器学习模型,从而更快、更可靠地解决能源需求、可再生能源生成和市场价格预测等挑战。高效的模型部署使团队能够快速扩展业务并轻松共享持 续的预测结果。Myst.AI的模型在多种行业中都可以被使用,例如能源、气候、人类行为等。其中,能源行业是Myst的特长行业,擅长帮助公司在使用新能源的能源环境下茁壮发展。 4)NVID