智谱 开源版本与商业版本的区别 Q:最近在忙什么? 张鹏:市场、客户。我现在的主要精力都放在ToB市场和研发这两件事上。 Q:内部怎么看待开源? 张鹏:开源是对智谱很重要的事情,最新成果都是以开源的方式放出来,再有商业的版本。 智谱 开源版本与商业版本的区别 Q:最近在忙什么? 张鹏:市场、客户。我现在的主要精力都放在ToB市场和研发这两件事上。 Q:内部怎么看待开源? 张鹏:开源是对智谱很重要的事情,最新成果都是以开源的方式放出来,再有商业的版本。符合开源先行的理念。 Q:最初为什么会选择开源? 张鹏:开源其实就几个事情:第一、将我们的大模型开源出去,让大家知道智谱在做什么。第二、开源以后,可以让更多的人参与进大模型,用社区的方式、汇集大家的热情一起来推动大模型发展,这是开源最重要的一件事。 并不是说要用开源去赢得市场或者为了追求商业上的利益,要不然就不会选择开源了,这是智谱一直以来对开源的定位。 Q:如何看待开源与商业的关系? 张鹏:开源的目的和商业不要混为一谈,开源和商业化是整个生态版图里很重要的两块,这两块是有连接的,可以说开源充当着商业化的桥梁。 Q:开源模型越来越多,对智谱有哪些影响? 张鹏:开源的多了,大家就多了一些选择。可以不用商用的版本,客户直接用开源的版本就好了,但这件事有好有坏。 Q:对于开源和闭源大模型,用户应该如何选择? 好处就是说可以低成本、快速地切入使用上大模型。但开源大模型在安全性、稳定性等方面很难得到充分的保障,这也是商业版本能够与开源版本并存的原因。商业版本可以提供更多的服务,更多的保障以及更多后续的服务,这些开源版本不一定有。 张鹏:得看他的目的是什么。如果他只是想做一些实验和尝试,那选开源模型没问题,如果想要在上面做一些商业化应用,我觉得大部分人还是会选择商业化版本,因为有保障,能够提供更好的服务。 Q:未来大模型开源会一家独大吗? 张鹏:不会,未来开源一定会百花齐放。 Q:如何看待未来开源与闭源的竞争? 张鹏:两者天生不是矛盾对立的,也不是竞争的关系。对于整个大模型行业来说,两者其实是互为补充的。开源是为了保持社区的繁荣和多样性,能够保证技术、产品能够源源不断补充新鲜的血液和产生新的变化,闭源的商业化的版本肯定是用来满足商业化的需求,商业化的需求是什么呢?是安全、低成本、高效、持续有价值的服务。所以两者的优势并不在同一个位置,就竞争来说,一定是同位的才会有竞争。 从这个角度来看,开源和闭源大模型两者是相互弥补的。 2 更聚焦于 商业化 ToB Q:行业里前段时间一直在讨论开源和闭源更适合ToC还是ToB,那智谱对大模型ToC、ToB的规划是怎样的? 张鹏:我们团队其实大部分的人都是ToB经验更丰富一些,今年才加入了一个专门做C端产品的团队,我们整个的商业化重心都在ToB上。ToC其实是一个很好地聚拢用户,达成所谓的“用户-数据”飞轮闭环的事情。但在中国,C端用户付费意愿一直不高。 Q:您觉得大模型领域,ToC、ToB哪条路更难走? 张鹏:对我们团队来说是ToC,但也在慢慢补齐C端团队。 Q:C端产品主要就是智谱清言,内部还有没有ABC几条产品线同时在做? 张鹏:暂时没有,我们还是希望做的事情更聚焦于商业付费用户这块,而付费用户还是B端客户更多。ToC目前还是以免费的方式在推动。 Q:ToB客户主要聚焦哪些行业? Q:如何获客? 张鹏:现在我们会选择一些行业去做,这个主要还是看市场、看客户的情况。首先得看行业是否具备基本的条件,比如说像基础设施是否发展完备。其次大模型这件事的成本并不便宜,要看客户的预算投入是否支撑得了。 张鹏:一种是直营,我们自己的销售团队、市场团队去获取的,第二种就是依赖生态,有我们的合作伙伴等,主要是这两种方式。 Q:做ToB时碰到友商次数最多的是谁? 张鹏:没太注意,应该都碰到过,大厂、创业企业都碰到过。 Q:在ToB、ToC遇到过哪些挑战? 张鹏:两者遇到的挑战肯定不一样,但有一些共性的挑战。首先是技术上的挑战,无论如何现在大家前面都摆着GPT-4,不管是B端还是C端,大家都会有意无意去拿这个标尺去量你。 客户都不傻,他们也会自己测试,去看国内最好的大模型水平能达到什么程度,这也是智谱最重视的。你可以想想,如果我们某一天真正能够做到GPT-4的水平,甚至赶超,那么现在面临的很多问题都能迎刃而解。甚至可以连商业模式都不用考虑,只提供API就行,目前大模型本质上就是技术上的挑战。 Q:这三种解决方案是什么? 第二是商业模式上的挑战,这块我们做了很多的探索,也有自己的的想法、理念和突破。比如在ToB,智谱给出了三种不同的商业落地解决方案,其实就是解决不同类型用户在不同成本条件下的落地情况,在这一点上我觉得我们智谱应该走的比较靠前。 张鹏:我们一直在跟大家讲的,我们有三种大模型的使用方法。 第一种就是直接用我们的API就行了,但大家都一样,API都是一样的,能力也都是标准化的。 第二就是当标准化的版本还不能满足需求的时候,例如客户需要做一些模型侧的微调优化、数据隔离、专属的算力支持等等,智谱就会提供在线的云端私有化方案。 第三种就是完全私有化,这也是最具中国特色的B端解决方案。 Q:哪一种方案占比较多? 张鹏:没有一个占绝对优势,但我们判断未来市场主流会逐渐转向云端私有化。 Q:云端私有化,客户会有安全性的考虑吧? 张鹏:这就要看客户如何平衡了。我们也会充分考虑这件事,会从技术侧提出解决方案。 Q:商业化上遇到哪些挑战? 张鹏:目前最大的挑战是,我们经常要向大家回答大模型到底能干什么?能给大家创造什么样的价值?我觉得这是因为大家对大模型这件事的认知还没那么深。早期的时候确实很难想明白,像今年年初ChatGPT发布之前,我们跟投资人聊的最多的就是问怎么商业化?谁会买它? 3月ChatGPT彻底出圈后,大家不再问这些问题,觉得这些都不是问题,但现在大家又开始回过头去关注这些问题。 Q:现在为什么又开始问这些问题? 张鹏:GPT爆火一下子把天花板捅破了,大家就会觉得商业化落地这个事情就找到了一个巨大的出口,但它只是技术上的一个出口,但大家就会脑补,把期望值拉得特别高。 一旦整个行业热情势能爆发,但模型能力的发展并不能持续支撑这种势能时,大家就会冷静下来,重新思考。 Q:那智谱有答案了吗? 张鹏:我也不知道这个答案最终是什么。可能也没有人能给答案去评一个分,或者设定一个标准答案。但这一年我们一直在和我们的合作伙伴、行业用户一起去探索这件事的答案。由于我们对底层技术的全盘掌握和资源的深入掌握,认知会更深刻一些,也会更快地去落地一些解决方案。 Q:能举个例子说明吗? Q:智谱未来的重心? 张鹏:比如模型擅长什么,未来发展趋势,我们积累的算法这些技术优势在商业化方面的优势,以及在用户的特别苛刻的情况下智谱如何去配合模型,即配合系统、配合应用开发去满足用户苛刻的指标要求。这些事情我相信只有对核心技术掌握得特别清楚的团队,研究特别深的团队才能做到。 张鹏:就两条腿走路,一条腿是继续追求技术上的领先,另一条腿是持续商业化落地。 Q:相对于其他创业公司,智谱最大的特色是什么? 张鹏:我觉得我们最大的特色就是从核心技术出发到整个商业化落地过程,我们都有自己的想法,是自主可控的核心技术,以生态为主的商业化落地的打法。技术上比较简单,我们就对标全球最好的,商业化落地的目标是把生态做的更大。 Q:以生态为主的商业化落地的打法怎么讲? 张鹏:这是我最近感触非常深的一件事。其实从商业化落地的角度来讲,很多时候大家看到的都是天花板以下的,假设市场就那么大,那我们要做的就是抢到更多份额,但在抢的过程中就会忽略掉蛋糕是不是可以做的更大,这样大家存活的空间就会更大,我们就在思考有没有可能实现共赢? Q:具体到大模型行业怎么做呢? 现在我们商业化的思路会偏向于生态共创,就是说我们不是杀到某个行业中去抢蛋糕,而是拿着我们的技术、工具、产品去赋能客户,去给客户创造价值,赋能我们的合作伙伴,希望在这个产业中我们的合作伙伴越来越多,最后跟合作伙伴一起把整个市场做大,把蛋糕做大,收益也就更大。 张鹏:我们会告诉大家智谱的定位就是做基座大模型,那么对于上层应用,贴近用户侧的事情交给合作伙伴去做,如果大家愿意跟智谱一起合 Q:什么时候有这种感悟的? 作,加入到智谱的生态中来用新的生态的方式去做,智谱很欢迎。目的是希望用了智谱的大模型以后,能够一起改变了整个产业原来的生产流程或者生产的范式,就等于提升了整个产业的天花板,受益的是生态里面的所有人。 张鹏:也就今年的事儿,ToB的前期,我们真正做这个事情的时候才发现确实是这样,大家考虑问题的方式确实不太一样。 3未来的关键节点: 看谁的大模型能率先追上GPT4 今年10月智源副院长刘江宣布加入智谱担任智谱首席生态官,智谱的核心团队再添新面孔。 Q:首席生态官主要是做哪些事情? 刘江:所谓生态,就是一个产业需要很多角色,角色之间是互相支持、共同发展和繁荣的关系,缺少了某些角色,整个产业的发展就会有问题。大模型赛道还处于早期,这时候寻找、培育和联合更多志同道合的伙伴,补短板,形成生态,大家共同把产业做大,是非常重要的。 Q:这里头涉及哪些方面? 刘江:目前比较重要的主要是几个方面。 首先,如何降低大模型的使用门槛,使它可以在更多行业和场景落地,除了大模型自身能力的不断增强,也需要工具链、中间层的支持。由于大模型行业处于早期,市场还在培育阶段,技术变化又很快,应用层的创业者很不容易。而应用层的繁荣是产业发展至关重要的。 最后,我们也希望学术界有更多优秀的学者、学生参与到大模型的研发中来。智谱AI前段时间发起了扶持大模型创业公司的“Z计划”,也与中国计算机学会和中文信息学会联合设立了大模型方向的学术基金。Q:您对开源怎么看? 刘江:开源其实发源于学术界,科学研究成果天生就是开源的,因为需要同行评审和复现,也有助于新科技的传播。智谱AI是清华大学科研成果转化而成立的,因此从一开始就拥抱开源,有很多知名的开源项目,比如国内最早开源的千亿大模型GLM-130B,还有ChatGLM-6B,各版本在GitHub的star数累计是所有开源大模型里非常靠前的。 开源是一种非常好的与技术同行交流和合作方式,能让更多人知道你、熟悉你,其中很多人进一步还能为项目本身做贡献。开源也是一种技术实力的验证。没有一定的技术底气,你是不太敢开源的。 Q:您觉得开源面临哪些阻力? 刘江:在企业做开源,最常见的问题是基本功能开源了,大家该如何设计商业模式。 Q:对比一众大模型公司,智谱的优势是什么? 刘江:应该是产学研用深度融合,我们有用户量较大的C端应用,也有很强的大模型B端商业化交付能力。Q:具体怎么讲? 刘江:大模型是一个科研属性非常强的技术产品,在某些关键技术点上,需要顶尖人才的灵光闪现。智谱源自高校科技成果转化,这方面是有独特优势的。 另外,智谱是国内最早开始做大模型的团队之一,技术沉淀比较厚,也较早地开始做相关的产品化和商业化交付,落地经验丰富。在今年 ChatGPT大火之前,它已经有了一定的先发优势。再加上创业公司本身节奏比较快,比较灵活,这在快速发展的市场上也是很重要的优势。 Q:整个行业本质上还是比拼什么? 刘江:最后比拼的还是长期的技术实力,大家的目标都是AGI,看哪个团队最终可以把AGI的路跑通。其他都是为了这个目标创造条件。