云从科技姚志强:大模型是登月工程,未来要重点做行业大模型2023-05-19未来的AI公司不再有分类,只有AI和非AI公司 Q:还记得ChatGPT发布当天,心情是怎么样的吗?这段时间的心情、状态都有哪些变化?姚志强:非常忙,我想应该全行业都在忙,大家都在忙着抢人。 其实去年底ChatGPT刚发布的时候,其实当时觉得是一次技术进步,说实话并没有那么地震惊。真正感受到震撼是这段时间,围绕AI的技术进展和应用越来越多,我也做了些更深入的理解,发现和之前技术突破完全不一样。 Q:震撼在什么地方?对这次AI技术突破,您最印象深刻的点是什么? 姚志强:原先我觉得技术突破是量变的过程,比如在某些性能上、指标上可能提升了又有百分之多少。我觉得AI远没到技术瓶颈期,通常来说,随着技术持续投入,进步都是可以预见的,但真正看到OpenAI的技术路线选择、最终实现效果来看,我意识到这是质变,而非量变的过程。 区别在于,以前我们做的小模型,是就很像是人类的社会分工,直奔目标,比如这个算法就只做人脸识别、车牌识别,我去收集数据标注数据,然后去训练它,未来的可扩展性其实就没有很多。但现在大模型的训练,是将它真正作为一个人来训练。我们用专家知识去引导他,给他启发性的这样思维,真正的去教导他去引导他,这是出现了“涌现”现象的原因。 Q:所以这是一次范式革命。 姚志强:确实。这件事情最颠覆的就是我们AI企业,颠覆我们的商业模式。未来,产品和技术演进思路全都要重新迭代,可能我们不会再有所谓的语音识别、自然语言理解、图像识别这些技术分类,剩下的只有AI——你是不是一家AI公司?判断AI基础能力的标准,可能就是大模型做得如何,在这个基础上再谈其他的行业模型、场景应用。 Q:一个老生常谈的问题,最近评估下来,您认为国内大模型和OpenAI的差距有多大? 姚志强:差距来说的话还是比较大的。ChatGPT是非常复杂的这样系统工程。他还不是一个简单的产品,我经常会把它比喻成登月。你说登月这件事,有哪一个技术环节或者理论你是没有的?都是已经现成的成熟理论和技术。没有什么特别复杂的,或者搞不定的。但你真正想做的时候,你会发现无比的艰难,因为这个事情非常复杂。 尤其是他最近放出来的一些公开资料,已经很含糊了,还是透露了一些不可思议的一些细节。比如说,他可以在做每一次的模型迭代的时候,不用把这个模型训练到最终结果出来,他就可以知道它的性能或者迭代结果。每提升一次性能,它大概只需要跑十分之一的计算量,这是一个非常不可思议的事情。 Q:大家最近也在讨论,要做成一个OpenAI,要怎么样才能赶上。如果让您来排个顺序,数据、算法、人才、资金,哪个是最难的? 姚志强:人才永远都是第一位的。再往后,可能是算力要更紧张一些,但这个是短时间内比较不平衡,需要周期性的调整。其次肯定是数据,大家已经讨论很多了,包括中文数据和英文数据在质量、开放性上面还是有很大的差距。 大模型是登月工程,未来要重点做行业大模型 Q:意识到这样的技术突破后,您和团队都做了什么?最近都在忙什么内容? 姚志强:我相信。所有的AI公司都会高度重视。我们也在做大模型,并且时刻关注现在的技术进展。我们现在也在公司团队内部做结构调整,包括也会招不同的人。 Q:在招人这个事情上,OpenAI对你会有怎么样的启示?大家现在都在抢顶尖人才。姚志强:恰恰相反,我认为要抓住年轻人。 我倒不是很执着于一定要找那种特别学术大牛、顶尖人才。认真研究OpenAI的人才结构,你会发现在美国,顶尖大佬很少加入OpenAI,相反,他们有太多小组的负责人都是20多岁左右的年轻人。在GPT-3.5出来前,大家就觉得OpenAI是一个很普通的公司,一群很普通的人,看起来在做不太主流的一些事情。 我觉得,正是因为年轻人不受束缚,在学术上没有所谓的流派、成见,才容易做出一些这些创新的东西。这才是值得我们认真去思考的。 Q:云从刚发布自己的大模型进展,前不久也发布募资公告,要募集36亿元来做大模型,主要会投入到什么方面?姚志强:主要是投入到人才、数据、算力。短期内,我们投入更大的肯定是算力方面。 Q:在做大模型这件事情上,云从最早可以追溯到什么时候? 姚志强:我们在几年前做公司规划的时候,就已经开始做语言、语音识别,那个时候对自然语言处理已经有部分投入,OpenAI的进展也是我们跟踪的其中之一。我们之前在一些OCR场景上,也是用大模型路线,部分场景已经能够复现OpenAI的能力了,有一些很接近他的一些想法和思路做,不过之前确实是小范围内的尝试。 Q:那么,在做大模型这个事情上,云从的思路是怎么样的? 姚志强:从思路上,我觉得其实各家技术路线是差不多,OpenAI已经把这个事情做成明牌游戏了。在技术上,大家都是在不停地提升通用大模型能力,不会再有犹豫。 一个很重要的一点是,在技术攻坚过程中我们肯定会考虑商业层面,一定要有商业化逻辑。我们是两条腿走路,一方面是提升通用大模型能力;另一方面是逐步打开行业场景和服务。 我们现在已经用这种行业模型的方式,去服务我们已经有的一些场景,比如我们已经有的银行客户,我们已经在提供部分大模型服务。而在通用大模型有足够多的能力之后,我们也会建立起应用生态,用投资、孵化等方式,找到更多应用场景。 Q:最近云从看到的用户需求变化是怎么样的,都集中在什么场景? 姚志强:需求一下就变多了。比如银行客户找我们,第一个需求就是写报告。银行做数据分析,比如里面的关联关系等等,是很刚需的。而大模型有很强的逻辑分析归纳的能力,在这方面来说,大模型天然有很强的优势的。 Q:云从的大模型定位也是做行业大模型,并且提出做“人和行业的接口”,这是为什么? 姚志强:我们还是从客户角度出发,首要任务肯定是服务好我们以前的客户,为他们做升级。云从一直在做ToB、ToG市场,这个市场的特点是,出于各种安全性,还有一些伦理的考虑,一定是要求私有化部署的。通用大模型天然对我们客户是不适用的,肯定是需要很多行业知识才能更好地解决问题。 Q:AI行业盈利难、交付一直是行业的老大难问题。做AI大模型后,您认为云从的产品形态,以及对客户的服务模式,会有变化吗?姚志强:首先对我们已服务的这些客户,可能不会有太大变化。 之前几年,我们做了很多关于人机协同操作系统这方面的一些工作,包括央国企客户适配性、开发接口等问题,其实我们都已经完成了。 大模型对我们整个产品体系来说或产品架构来说其实影响不太大,更多是提升了我们的性能。原先我们可能说要不断的要在这里面添加小模型,那现在,我只要替换成一个大模型。而中间可能会有一些特殊的行业线应用我可能会变成行业模型。 Q:相当于说是现有客户已经建立起服务模式,云从所做的是把一些零件换成大模型而已。姚志强:对的。 Q:AI大模型会给云从带来什么新的场景?AI公司以后赚钱,是更容易了吗? 姚志强:AI公司赚钱肯定会更容易。我们未来会探索一系列新场景,技术大突破为我们带来的效益会是比较可观的。比如,像智能客服这个场景,因为大模型技术突破,我们已经可以给客户提供的智能客服服务效果会更好,以云服务的方式。这就降低了交付成本,不需要很重的定制化服务了。在商业化模式上,我们肯定会有探索,比如在新客户、新场景里探索服务分成的模式,那这就要看我们和客户之间的沟通了。 Q:现在云从的四大业务板块是智慧金融、智慧出行、智慧城市和治理、智慧商业。以后有哪些场景、领域,是云从可能去探索的? 姚志强:比如在智能制造、文娱、大健康等场景,是我们比较关注的方向,以后也会做更多探索。Q:如果说做个预估,未来,你认为做大模型比较大的挑战会是什么? 姚志强:在于未来巨大的场景不确定性。比较封闭的、或者说很有垄断性的行业,可能变化程度会有限一点。但未来业务重塑之后,会是一个什么样的情况,我们确实要积极地和客户一起探索。另外对于新场景,挑战在于会不会错失机会?如果没有抓住新场景机遇,就可能会慢慢落伍了,很多公司就是这么错失一个时代的。 大模型加速了AI“第三浪”的到来 Q:之前云从曾经提到过人工智能的“三浪”理论。AI大模型技术突破后,您的看法有哪些变化?姚志强:我们所说的人工智能三浪,第一浪是做是做单点的AI技术,比如做人脸识别、车牌识别,这是小模型时代了;第二浪是指把很多的技术进行组合,就串联起来,做成一个业务闭环,解决公众号新价值人客户的实际问题,这里的流程会比较长,有时候可能不会因为一个点的技术提升就会导致整个流程有很大收益;第三浪是AI将成为未来世界的入口,形成平台和生态。 AI大模型出现,加速了我们对未来的这样一个预测。我们认为,现在属于二浪到三浪的共振的时期。改变未来的交互的入口,大模型确实在做这样的事情。 Q:在去年和我们的对谈里面,您其实提到了一个观点是,第二浪里面就很多把很多模型串联起来,可能会导致说未来人工智能的软件跟硬件会逐渐解耦。但最近大家也有讨论,AI大模型会让AI进入重工业时代,包括软硬件会走向耦合,软件边界变得模糊——IaaS、PaaS、SaaS的概念可能都不会存在。你如何看待这种趋势? 姚志强:软件层、或者说AI这层的能力明显是更强了,原先需要100个小模型,现在只要一个大模型了。从投入和最终能实现的效果来说,已经完全可以有能力独立成为一个产品形态,占据产业链中的一个位置,所以我们说它天然的就已经可以实现和硬件进行解耦了。 是否解耦,这是一个话语权问题。比如说OpenAI,它已经是一个很鲜明的代表。做模型训练有两个关键,第一个是有量,有足够大的计算量;第二个是有料,有足够多专家知识。 如果OpenAI能把一些垂直行业的问题解决了,那就很容易被整合,比如说智能客服这个场景。Q:AI大模型比较容易被颠覆的会是什么场景,不那么容易被颠覆又是什么? 姚志强:主要还是看场景是泛化,还是专业化的。如果说是一个很专业化的东西、场景固化、有一定垄断性,那不太容易,比如金融、医学。但行业壁垒相对比较弱的这些行业,是被容易攻破的。Q:过去近十年里,云从自己也经历了从初创到上市的道路,经历了AI从极速繁荣、走到低谷,再因为大模型回归全球焦点。回顾这几年,你最大的感悟是什么? 姚志强:最大的感悟就是,只要你在正确的道路上,你就会比一般人要更幸运一些,要顺势而为。Q:正确的道路指的是什么? 姚志强:每个关键的时点,我们都会发现好像都会有一个重大的事件出现,让人工智能赛道又火了一把,每次都是这样的。我认为,这背后的逻辑是:人工智能一定是大的发展趋势。这一点,我们从来没有改变和质疑过。 Q:现在呢?AI大模型出来后,你的对AI的看法有什么变化?去年的采访里,你曾经提到,不要把人工智能想象的那么强大,用机器去替代人还是很难做到。 姚志强:对,我的思考也确实有很大变化。ChatGPT确实证明了,通用人工智能已经爆发。一年前,业界对技术路线的预测还是那种线性的,但现在确实已经是非线性的变化了。对我们而言,以后肯定要加快对技术的跟进,赶紧奔跑吧。 2015年后,受AlphaGo影响的涌现的一批AI公司,都主要先围绕计算机视觉(CV)方向成长起来,云从科技就是典型代表。在ChatGPT推出后,随着不断有新技术成果冒出,以及围绕AI生态的应用出现后,姚志强意识到,一个全新的时代即将来临。“非常震撼,ChatGPT的技术突破,是质变,绝非简单的量变。”云从科技联合创始人姚志强表示。 和兴奋并存的,是对于AI领域迎来巨变的忐忑。“最先颠覆的,肯定就是我们AI企业。”他表示,“未来,产品和技术演进思路全都要重新迭代,可能我们不会再有所谓的语音识别、自然语言理解、图像识别这些技术分类,剩下的只有AI——你是不是一家AI公司?判断基础能力的标准可能就是大模型做得如何,再谈其他的行业模型、场景应用。” AI界的共识也已经形成——通用大模型是基础,但往后的产品化、商业化则决定企业的生命力。此前,云从创始人周曦就在公开报道中提及,大模型对全行业、对入口和内容,都会