专家交流纪要 交流对象:西湖心辰技术负责人交流时间:2023年7月9日 问:公司大模型研发进展如何? 答:目前研发人员增长迅速,在大量招聘数据工程人员和算法人员。主要的研发方向有三方面:第一方面是基础模型的训练;第二方面是模型能力的延伸,包括长记忆能力、个性化订制的能力以及情感感知能力;第三是具体的算法的实施落地,这方面需要一些更加外围的算法,例如根据各个场景进行文档解析、模型微调和意图识别等。目前主要精力还是集中在基础模型和延伸能力的提升,以及降低部署成本。 专家交流纪要 交流对象:西湖心辰技术负责人交流时间:2023年7月9日 问:公司大模型研发进展如何? 答:目前研发人员增长迅速,在大量招聘数据工程人员和算法人员。主要的研发方向有三方面:第一方面是基础模型的训练;第二方面是模型能力的延伸,包括长记忆能力、个性化订制的能力以及情感感知能力;第三是具体的算法的实施落地,这方面需要一些更加外围的算法,例如根据各个场景进行文档解析、模型微调和意图识别等。目前主要精力还是集中在基础模型和延伸能力的提升,以及降低部署成本。 问:公司大模型的情感感知(EQ)功能,是怎么感知用户的情绪状态的?技术特点是什么? 答:主要通过提升模型本身对话语和对用户的理解能力,两个方面来方面提升对用户情绪感知的能力。首先,我们会对情绪进行细致的识别,让模型实时感知并记住用户的情绪状态。其次,也会对用户的性格以及所处状态进行深度建模,这样即使用户在没有显式地表达出情绪的时候,模型仍然能够去感知。 业界大模型目前的研发侧重在模型本身,缺少对人(模型的交互对象) 的关注。提升大模型的EQ,能使模型更好地与人交互,更深地理解并满足人的需求。 当EQ增强之后,用户更愿意和大模型互动。美国大模型公司Character.ai构建了一大批AI虚拟角色来陪用户聊天,目前月活跃用户超过1200万,估值达到数十亿美金。Character.ai的用户平均交互时长超过28分钟,而ChatGPT不到5分钟。另一家美国大模型公司Inflection.ai也推出了聊天机器人Pi,相比ChatGPT具有更强的共情能力,对人友善且细腻;最近刚完成了13亿美金的融资,估值约50亿美金。 情感大模型不是垂直领域模型,而是覆盖面很宽的通用大模型,因为对话的范围非常广。其需求覆盖各行各业,包括娱乐(如数字人)、 游戏(如智能NPC)、社交(如虚拟伴侣)、教育(如虚拟教师)、医疗(如虚拟医生)、金融(如智能投顾)等。这些场景里,大家需要AI更像人一样的提供服务,而不是冰冷的机器人。 问:西湖心辰与Character.ai、Inflection.ai这些同类产品相比,有哪些异同点? 答:西湖大模型、Character.ai、Inflection.ai都聚焦于提升大模型的情感能力,致力于解决大模型无法很好理解人类意图,无法与人类建立深层情感链接的问题。 Character.ai的机器人有很多是用于角色扮演类的虚拟角色,人们在用Character.ai时,很多时候是用一种游戏的心态在使用,并没有真实的去建立情感链接。 Inflection.ai当前的产品偏Demo的层次,聊天体验有一定的主动情感能力,但和Character.ai一样,都没有长期记忆。 西湖大模型是一个结合了文本/图片/语音/视觉多模态能力的大模型,模态之间会深度融合,模型能从多种模态中共同获得信息进行更深度的推理,在长期记忆能力的支持下,可以展现出很类似人类的交 互沟通能力,这都是目前Character.ai、Inflection.ai不具备的。 我们的规划是,在1年内,模型的“情商”达到国际顶尖,“智商”保持在国内第一梯队。问:情感感知是一个新的AI赛道吗?商业前景如何? 情感感知只是一种具体能力,人格化AI是一个新兴且市场巨大的赛道:覆盖各行各业,包括娱乐(如数字人)、游戏(如智能NPC)、社交 (如虚拟伴侣)、教育(如虚拟教师)、医疗(如虚拟医生)、 金融(如智能投顾)等。这些场景里,大家需要AI更像人一样地互动并提供服务,而不是工具化的机器人。AI技术第一次进化到了可以完全像人一样来提供服务,并且在各种应用场景中给人提供情绪价值 和服务。 问:公司目前的商业化进展如何?有什么具体的商业应用反馈? 公司从2022年就开始推出智能文本写作和智能绘画的C端产品,积累了约200万海内外用户。在B端,与星巴克、知乎、支付宝等合作推出了一系列的基于生成式AI的服务。 与知衣科技合作,共同推出了时尚大模型(FashionDiffusion),服务服装行业的设计师人群快速生成服装风格设计图,变革了行业设计模式。 和汤姆猫(300459)达成了战略合作,会共同推出能听能看能说,能教知识能陪伴学习的汤姆猫系列产品。当前汤姆猫家族APP全球 拥有4亿月活,预计全面接入西湖大模型后,会带来显著的用户使用时长上升,每年模型调用次数可能达到千亿级。这将是大模型领域很显著的应用落地场景。 问:未来会有哪些商业模式?哪些收费方法、定价? 商业模式为收取模型定制费用、模型调用费用,或从产品收入中获得 分成。比如我们和知衣科技正在联合训练时尚大模型(FashionDiffusion),共同服务数千家服装设计公司,我们会从B端订单中分成。目前我们还在与多家公司联合训练行业模型并进行商业化探索。 问:目前国内AI大模型的行业进展情况? a)国内大模型发展迅速,模型能力的提升也非常明显。 b)国内大模型在基础模型的研发上还是有着非常强的头部效应,仅有包括西湖心辰在内的少数几家头部公司能建设拥有完全自主知识产权的大模型。 c)商业化目前还是处于比较早期;无论是模型能力还是产业落地方面还有很大的发展空间。特别是B业务的落地方面,还有比较大的空间,有大量的低垂果实亟待商业化落地。 d)互联网大厂现在在行业落地方面挑战比较大,因为行业落地对大模型的准确率要求高,大模型现在还经常乱说话。情感陪伴方向容错率高,容易落地。