嘉宾:国内一级美元投资经理 OpenAI做得最重要的事情就是底层闭源的ProprietyFoundationModel,大语言模型是GPT,文生图是DALL-E-2。同时也有很多公司在做开源模型。此外基础底层还包括modelHub(模型库)、开源数据集等。 中间层是工具层,服务新的基础设施长出新东西的层级,在foundationmodel基础上还需要做 promptengineering和training,中间层就是围绕这两件事情展开的,帮助用户更好的做prompt和training,代表公司为LangChain、Fixie。此外,值得注意的是,工具层是当前的机会,未来可能底层基础设施可能会做应用层,就不会存在工具层。现在之所以存在,是因为应用层需要工具帮忙开发AI+应用;长期是否成为独立的商业模式是存疑的。此外,针对deployment也有人做,也就是如何更好的评估和优化模型,比如海外的HoneyHive和HumanLoop。 上层是应用层,是目前数量最多的一层,理论上市场空间最大,门槛稍低一些的层面。目前有两类公司:1)类似于Notion、Unity、Adobe等传统软件公司,现在可以 加上AI功能;2)新AI初创公司,但不是所有初创公司都是AInativeapplication。现在大部分AI创业公司都是在做AI+Saas。 AI+SAAS是指已有既有的软件能解决某类需求,现在加上AI能更好解决需求或降低使用门槛或者提升效率。AInativeapplication指的是以前软件公司不能解决,但是AI可以提出来新解决的应用方向。比如TOC的知识管理库,以往人类传统接受信息量的方式是搜索+零星的内容获取,之前没有人解决如何更高效的获取知识这一问题,现在chatGPT可以理解用户的需求,通过学习过往阅读的信息,并提取用户的搜索关键词,从而定期推送和总结给用户。 现在所有的创业公司都要回答两个问题:1)怎么和chatGPT竞争?和企业场景以及和私域场景结合较深的是未来比较好的方向,即是否可以切到企业的工作流以及私 域数据,比如BI和featurestore;2)怎么和现有 SaaS公司竞争?我们认为诞生比较厉害的公司,要么是底层模型公司,要么是AInativeapplication。 国内重点公司 底层除了大厂外,minimax是闭源的 fundamentalmode(l小fundamentalmodel+应用的形式)。国内做底层的公司主要包括两类,一是完全复刻GPT;二 是希望底层有一些突破的,主要是在diffusionmodel进行优化和改变,很多实验室背景的研究院愿意研究多模态的底层模型。 阿里三个团队,一个做大语言模型,一个是做文生图模型,还有个是做多模态模型的(偏实验室角度)。 Q:目前国内主流大模型参与者哪些比较有机会?A:站在全球视角看,华人做一个比较大的模型是比较难的。国内视角看,主要是国产替代逻辑,比如智源研究院、清华朱军教授的实验室等。底层模型需要具备哪些条 件:1)足够多的钱,OpenAI每个月要给微软5000万美 金的算力费;2)芯片,清华人大等学院有芯片+买得早(商汤、阿里等储备比较多),现在大面积买比较难; 3)工程能力,OpenAI今天的突破不是底层学术的突破,而是工程的突破,如何训练和预处理大数据集,是个很复杂的事情,要有经历模型训练和推理的人才,国内还是有这类人才的,没有大家想的那么悲观。AI四小龙也 都是经历过中等模型的,只是NLP没有坚持太久而已。4)流量入口和场景。在这四个方面,大厂的优势很明显,钱和算力的起跑线差不多。个人比较看好字节,其次 是阿里和腾讯。百度AI人才密度比较高,有先发优势,并且有工程化探索的经验。场景上市字节和腾讯比较好,腾讯偏语言模型,字节偏内容模型。 未来语言和内容线会融合成真正的多模态,目前更多是两个模型的融合(GPT4是input图片output文字),未来可能是input文字图片各种形式,output文字图片各种形式。 底层方面,大厂希望更多,创业公司长期活一家左右。应用层方面,大厂更有机会。 Q:GPT时代,国内软件公司替代国外软件巨头是更容易还是更难?A:个人感觉是更难。企服软件包括两大类:1)企业管理 流程的线上化,比如CRM等;2)面对专业使用者的工作软件,比如Adobe。第一类软件目前受到影响较少,他们的核心是把管理理念注入到软件中;第二类工具软件方 面,华人在定义工具软件方面比较弱,并且这一波AI中大部分受益者是既有的SaaS,中国公司不占优势,比较难弯道超车。但中国公司比较擅长做C端、供应链相关的产品,比较看好重新定义一款C端的应用。此外,中国也比较擅长软硬结合的东西,可能在这方面会做得比较好。 Q:AI+制造业/医疗业是否会带来明显的变化?A:制造业目前没有看到太大的影响。偏工作流程软件在 这波中受到影响不大,受影响比较大的是多模态 ChatGPT+机器人,目前机器人还是上一代技术,前端加摄像头控制,暂时没有语义和交互的功能,如果GPT功能融合到自动化机器手臂中,会比现在做得更好。目前ChatGPT创造机会比较大的是线上化的行业,传统行业目前这波影响比较小。 Q:是否是只有能力达到3.5才对应用进步更有意义?国内突破GPT3.5的瓶颈是什么? A:3到3.5有一个很大的提升,但目前国内还处于复现 3的阶段。3已经对长文本的理解有很好的效果,但3不是TOC的东西,达到3是有意义的,当时3也催生出Copilot等公司。想从3到3.5,核 心还是要解决工程化的能力和中文数据集质量的问题。目前文心一言效果不太好,不一定是3和3.5区别的问题,可能是工程化能力不够以及中文数据集较差。工程化能力问题只能找踩过坑的人去问避哪些坑。 Q:大模型对工作台等软件(Adobe)的影响?midjourney等软件是否会被GPT颠覆?A:这波AI是对既有的头部SaaS公司的利好,主要是:1)加上AI后ARPPU增加;2)免费到付费的转化率提升,付费意愿提升。但这些利好的前提是本身这个SaaS有很多注册用户,不然就没太大利好。MJ替代是原画师和图库,而不是最终可以商业化的素材(比如营销物料、海报等)。如果MJ不沿着垂直领域做深的话,可能会被GPT颠覆掉,最好还是output真正垂类可商业化的东西,比如用AI生成海报,而不是图片。MJ目前在包装等垂类行业的尝试是很好的。AI想去替代人力成本是走不通的,只有比人创造的更好,比如设计官网、产品主页等。 Q:GPT模型的成功是否会拉开商汤等传统AI公司的差 距?什么场景不容易被大模型颠覆?A:AI四小龙方向主要是CV,但GPT主要是NLP方向。四小龙也在尝试做大模型,目前和互联网大厂相比都 是从头开始;但四小龙之前训练过中模型,相较于传统云厂商更有优势一点,但优势不明显。目前难颠覆的是传统非线上化的行业,实体企业受影响更小;线上的话,如果和私域数据结合的紧密一点不容易被颠覆。