行业研究|动态跟踪 看好(维持) 他山之石系列报告(四):Cohere专注自然语言处理,降低企业应用AI风险 计算机行业 国家/地区中国 行业计算机行业 报告发布日期2023年07月24日 核心观点 Cohere致力于为企业定制生成式AI服务。Cohere成立于2019年,Cohere专注于为企业提供文本类生成式AI服务,可基于企业数据进行模型定制。2023年6月8 日,Cohere获得了2.7亿美元的C轮融资,投资者包括Oracle、Nvidia、Salesforce等。Cohere的估值也随之来到20亿美元,在基础大模型领域仅次于OpenAI和Anthropic。 Cohere聚焦于企业市场,其垂直应用产品集中在企业运营过程中与文本有关的领域。目前,Cohere主要面向B端企业客户,根据企业专有数据创建定制AI。其模型可以理解企业数据、交互式聊天,用于搜寻、内容审核和意图辨识,成为决策工 具。Cohere的垂直应用产品集中在企业运营过程中与文本有关的三个关键领域,分别是文本生成、文本分类和文本检索。文本生成领域有Summarize、Generate、CommandModel;文本检索领域,有Embed、SemanticSearch和Rerank;文本分类领域的主要产品是Classify。 安全部署、定制化和良好的客户支持是Cohere的核心竞争力,针对ToB领域特性提供差异化竞争能力。Cohere在满足企业的安全需求的前提下,积累了丰富的企业用例,能够依据不同企业的专有数据做定制化模型,并且提供充分的客户支持,在 企业应用AI的任何阶段都能够提供帮助。Cohere以自研基础模型切入ToB领域,拥抱企业和开发者,针对B端企业的常见痛点,针对性提供具备高性能、高安全性、多云适应性和数据可控性的模型,是其能够与OpenAI等企业进行差异化竞争的关键。 Cohere的定价策略更加精细化,价格低于OpenAI。Cohere采用了按需付费模式,按照模型的不同能力如文本生成,文本总结,重新排名,文本分类等分别制定了不同的价格,而在每一种能力里,模型是否经过定制化,价格也有区分,客户可 以根据自己的不同需求任意选择能力和模型的类型。和OpenAI微调系列模型的API 价格相比,Cohere的产品价格更低。 Cohere提供与云无关的AI平台,保护企业用户的数据安全。与云无关性(cloud-agnostic)是指不依赖于哪一个云服务平台,应用程序、工具和服务等可以在多个云 平台之间或本地和云之间无缝迁移。Cohere的企业AI套件与云无关,提供最高级别的灵活性和数据隐私。该平台旨在在每个云提供商上均可用,部署在客户现有的云环境、虚拟私有云甚至本地部署,以满足其数据所在的公司的需求。企业数据永 远不会离开用户的环境,企业也更容易将工具和功能集成到其现有的技术栈中。 证券分析师浦俊懿 021-63325888*6106 pujunyi@orientsec.com.cn 执业证书编号:S0860514050004 证券分析师陈超 021-63325888*3144 chenchao3@orientsec.com.cn 执业证书编号:S0860521050002 证券分析师谢忱 xiechen@orientsec.com.cn 执业证书编号:S0860522090004 联系人杜云飞 duyunfei@orientsec.com.cn 联系人覃俊宁 qinjunning@orientsec.com.cn 联系人宋鑫宇 songxinyu@orientsec.com.cn 投资建议与投资标的 我们认为,Cohere在ToB赛道的探索为国内相关的基础大模型厂商和企业软件厂商提供了参考,大模型在B端软件领域有望率先落地。 大模型领域,建议关注科大讯飞(002230,买入)、三六零(601360,未评级)、拓尔思(300229,未评级)等公司。 B端软件领域,建议关注金山办公(688111,增持)、泛微网络(603039,未评级)、汉得信息(300170,未评级)、彩讯股份(300634,未评级)、致远互联(688369,未评级)、用友网络(600588,买入)、鼎捷软件(300378,未评级)等公司。 风险提示 技术落地不及预期;政策监管风险 他山之石系列报告(三):Adobe大力发展 生成式AI应用 他山之石系列报告(二):大模型应用开发框架LangChain梳理 他山之石系列报告(一):Salesforce的大模型ToB应用分析 2023-07-18 2023-07-16 2023-07-05 有关分析师的申明,见本报告最后部分。其他重要信息披露见分析师申明之后部分,或请与您的投资代表联系。并请阅读本证券研究报告最后一页的免责申明。 目录 一、Cohere:OpenAI的强力竞争对手,专注自然语言处理4 二、模型定制或成为B端落地主流,云无关性保护企业数据安全7 三、投资建议与投资标的9 风险提示9 图表目录 图1:《AttentionisAllYouNeed》4 图2:Cohere获得2.7亿美元C轮融资4 图3:Cohere能力和产品矩阵5 图4:CommandBeta(52.4B)模型在HELM中排名第二5 图5:安全、定制和客户支持是Cohere的核心观念6 图6:Cohere可以针对企业进行模型定制训练6 图7:通用大模型具备较好的泛化能力8 图8:数据在大模型到落地应用之间承上启下8 图9:基于云的、云原生的和与云无关的区别8 表1:Cohere主要产品功能介绍4 表2:Cohere的产品定价6 表3:OpenAI的产品定价7 一、Cohere:OpenAI的强力竞争对手,专注自然语言处理 Cohere致力于为企业定制生成式AI服务。Cohere成立于2019年,联合创始人兼CEOAidanGomez是2017年学术著作《AttentionisAllYouNeed》的作者之一,该论文在人工智能研究领域具有里程碑意义,推动了计算机分析和生成文本方式的进步,ChatGPT等现代大型语言模型都由其基础衍生。2023年6月8日,Cohere获得了2.7亿美元的C轮融资,投资者包括Oracle、Nvidia、Salesforce等。Cohere的估值也随之来到20亿美元,在基础大模型领域仅次于OpenAI和Anthropic。Cohere专注于为企业提供文本类生成式AI服务,可基于企业数据进行模型定制。 图1:《AttentionisAllYouNeed》图2:Cohere获得2.7亿美元C轮融资 数据来源:Google,东方证券研究所数据来源:Cohere,东方证券研究所 Cohere聚焦于企业市场,其垂直应用产品集中在企业运营过程中与文本有关的领域。目前,Cohere主要面向B端企业客户,根据企业专有数据创建定制AI。其模型可以理解企业数据、交互式聊天,用于搜寻、内容审核和意图辨识,成为决策工具。Cohere的垂直应用产品集中在企业运营过程中与文本有关的三个关键领域,分别是文本生成、文本分类和文本检索。文本生成领域有Summarize、Generate、CommandModel;文本检索领域,有Embed、SemanticSearch和Rerank;文本分类领域的主要产品是Classify。 表1:Cohere主要产品功能介绍 领域 产品 主要功能 文本生成 Summarize 文本摘要生成器。能快速概述和总结文档的关键点,可以支持输入10万个字符和文本格式选项 Generate 内容生成器。可以为各种目生成独特的内容,比如电子邮件和产品描述等 CommandModel 能够接受用户个性化命令训练的文本生成模型。企业用户在将自己的数据和Command结合后,就可以产生自己独有的语言模型,能够在企业的实际业务中立即发挥作用 文本检索 Embed 把多模数据转化为向量,帮助机器理解信息;再将向量转化为多模数据,帮助机器输出人类能理解的答案 SemanticSearch 查找基于语义的相似文档、评论等,可快速找到所需内容,提供 有关分析师的申明,见本报告最后部分。其他重要信息披露见分析师申明之后部分,或请与您的投资代表联系。并请阅读本证券研究报告最后一页的免责申明。 高性能的多语言搜索功能 Rerank 可以基于语义相关性分析现有工具的搜索结果并进行排名,从而提供更丰富、更相关的结果,且对用户的干预或编程经验要求很小 文本分类 Classify 使用户能够个性化地组织信息来帮助内容审核、用户分析和进行聊天机器人体验。比如通过快速标记不同类别的客户来进行高效的客户服务,识别正面和负面的社交媒体评论来了解客户反馈 数据来源:Cohere,东方证券研究所 Cohere支持训练自定义模型,通过CoherePlatform可以轻松实现。除基本的NLP能力外,Cohere也为企业提供企业对话AI代理,这款产品能够回答基于客户公司知识的问题,并可以执行操作和推动流程。如果企业用户在Cohere的现有产品线中找不到用例,Cohere会为企业提供产品定制。Cohere还具有高水平的数据安全和隐私保护,能够将模型部署到指定云平台、虚拟私有云、甚至本地部署。Cohere为开发者提供了开发者平台,通过Cohere平台可以通过几行代码将自然语言处理和生成集成到产品中并且提供包括分类、语义搜索、改写、摘要和内容生成等能力,并训练自定义模型。 图3:Cohere能力和产品矩阵 数据来源:东方证券研究所绘制 Cohere针对各个产品推出不同尺寸的模型,其中用于企业用户的Command模型更适合定制和微调。Cohere提供了summarize、rerank、embed、base、command等各种不同功能的系列模 型,每一个系列都提供不同大小尺寸的模型供用户选择。Command模型是Cohere的核心生成式对话模型,曾推出过524亿、131亿、61亿和4.1亿参数等多个尺寸的模型。在斯坦福大学的语言模型全面评估(HELM)中,从最大的524亿参数Command模型微调得到的对话模型CommandBeta在总共61个模型中排名第二,准确率90.6%,仅次于OpenAI的text-davinci-002模型,优于text-davinci-003模型和GPT-3.5-Turbo模型,这三个模型都属于GPT-3.5系列模型。目前Cohere对Command模型系列进行了优化,提供了标准版Command模型和轻量化模型Command-light。 图4:CommandBeta(52.4B)模型在HELM中排名第二 数据来源:HELM,东方证券研究所 安全部署、定制化和良好的客户支持是Cohere的核心竞争力,针对ToB领域特性提供差异化竞争能力。Cohere在满足企业的安全需求的前提下,积累了丰富的企业用例,能够依据不同企业的专有数据做定制化模型,并且提供充分的客户支持,在企业应用AI的任何阶段都能够提供帮助。Cohere制作了适合各类开发人员的NLP工具包,以便客户在不依托云的情况下就能够使用AI来解决语言相关的问题,让模型能在私有云或本地部署中运行。Cohere以自研基础模型切入ToB领域,拥抱企业和开发者,针对B端企业的常见痛点,针对性提供具备高性能、高安全性、多云适应性和数据可控性的模型,是其能够与OpenAI等企业进行差异化竞争的关键。 图5:安全、定制和客户支持是Cohere的核心观念图6:Cohere可以针对企业进行模型定制训练 数据来源:Cohere,东方证券研究所数据来源:Cohere,东方证券研究所 Cohere的定价策略更加精细化,价格低于OpenAI。Cohere采用了按需付费模式,按照模型的不同能力如文本生成,文本总结,重新排名,文本分类等分别制定了不同的价格,而在每一种能力里,模型是否经过定制化,价格也有区分,客户可以根据自己的