特邀嘉宾:云从科技(28.66,4.78,20.02%)董事长周总 【首席前言】 过去两年全球科技领域融资比较低迷,但是AI方面的革命性创新(如机器人(10 .49,-0.14,-1.32%)、ChatGPT、AIGC)为未来带来希望。近期科技投资的热度进入底部区域,AI方面的新进展层出不穷,基于对机器人导入期的研究、后续ChatGPT、AIGC的研究来看,新一轮的科技投资周期以及科技发展周期里,人工智能是目前全球科技发展、科技投资的核心。 【行业分享】AI发展: 1)软件:两个派系,分为数据派(有更多的数据来训练更大的模型)和知识派(加入人的知识,通过知识来建立规则,向专家系统发展)。随着deepLearning的发展,即2016年开始,数据派占优,大量数据会支撑模型优化,在计算机视觉上有突破性进展。2016年的代表AlphaGo带动资本浪潮,在AlphaGo时代,围棋上的成功并不能带来很大现实应用,而ChatGPT重要的推进是,其现实应用更多,类似助理。 2)技术:使用的模型与2年前发布的GPT3模型底层数据和模型规模一致,ChatGPT的突破性进展在于引入了人的知识,而非扩大了数据,即人类反馈的强化学习。简单来说,以前监督学习的大数据训练也需要人为标注,标注比较初级 ,而chatGPT的标注是来源于专业人士,把人类对于问题最好的回答回传,教练模型最大程度挖掘大数据,在各个具体的领域训练、精修,很好的结合了之前两个派系(数据派和知识派)。 3)未来chatGPT的发展将得益于人机协同,将人的知识和数据的能力做更好的结合。其优势在于:a)使得各个应用场景的门槛降低;b)如果技术非常场景化,通用性就变差,基础研下技术的高成本难以分摊,但是通过ChatGPT的范式,可以做到核心技术的投入、算力、算法的通用化,人的标注可以快速做场景的应用,边际效用增长,会大大加速各个行业的智能化升级。c)目前chatGPT深入产业链解决问题,比AlphaGo更振奋人心。 AI和产业落地结合,从一横一纵来看: 1)横:人的能力包含感知、认知、行动。关于认知体系,ChatGPT主要是是认知的环节,不包含感知;关于感知体系,感知主要指云识别和CV,如果没有感知,物理和数字世界无法打通,而未来的大模型包含视觉、语音、自然语言的大模型,这才是未来的发展方向;关于行动体系,AI与人的互动有三种:托管(主要依赖于AI来做)、伴随(人和AI一起操作)、问答(以人为主,操作过程中有问题通过语音或文字输入的方式询问AI),三种从强到弱,前两种无法实现是因为没有与物理世界打通。 仅从软件角度来看,未来强AI一定要将视觉、语音、自然语言、大数据融入,软件逻辑需要横向打通。如果将软件结合实体,数字人(9.01,0.28,3.21%)与实体机器人打通,会带来巨大的突破,完成完整的横向逻辑。 2)纵:即产业链的发展,类似汽车厂商的产业链分工。Tier3:AI里的Tier3是 大量要解决的技术点,场景、文字、行为等识别都是单点技术,都需要大量资源投入,由各个供应商来突破,通过SDK或者API来提供;Tier2:需要技术平台整合各种技术,比如通用的视觉、语音、自然语言处理平台、人形机器人组件的平台;Tier1:Tier1品牌商类似汽车里的整车厂商,设计AI整个数字人、人形机器人的厂商,面向场景应用形成各种产品,比如家庭医生、造型设计师等数字人产品。 早期,一些公司会占据多个定位,纵向拉通;随着产业链的分工的细化,未来每个层次里都会有很多的机会和公司参与,数字人和实体机器人可以应用的行业领域非常多,在每一个行业下面都会形成巨大的市场空间,产业体系下的产品会在多个场景下赋能。 【Q&A】 Q:从训练的数据集、模型的体量来看,国内达到chatGPT3.5,模型能力、数据能力、标注能力,2年之内有没有可能形成对标的类似产品? A:国内从NLP角度来看,百度(143.060,-8.230,-5.44%)、华为、清华、鹏程实验室的大模型数据量、参数规模不亚于GPT3.5,达到千亿级数据,甚至数据量和模型都会更多。下一步要解决的问题还是要更好地和知识做接入。 从目前来看,两年对国内信心较足,1)算力、数据量没有差距,追赶较快。2 )未来做教练模型、强化学习、经验模型,不一定要由少数大公司来做,可以由既掌握深度学习大模型的核心技术、又有行业理解的公司来做,形成生态的丰富化,对于本身有AI布局的公司来说都是机会。云从在计算机视觉、语音、NLP上遵从模型和知识相结合、再做教练模型、再做经验模型的思路推进,国内头部企业都会按照chatGPT验证成功的这个范式来推进。 Q:GPT3.0和GPT3.5的差别很大,对于知识点的回应比较全面,chatGPT3.5距离通用型人工智能还有多远的距离? A:通才是一件比较困难的事情,目前GPT3.5总是在讲“正确的废话”,具备了语言组织的框架和逻辑,但是对于某个特定领域的回应不够深,内行人会觉得有所欠缺,教练模型就是为了提升专业性,可以通过数据和知识(行业KnowHow)来训练。 如果想让通用型人工智能在某个方面做的非常专业是比较容易的,能解决某个领域已经具备很大的现实意义。 Q:微软(258.350,-6.250,-2.36%)对此最感兴趣,Office和Bing上都会做投入 ,投资在百亿美金的级别,如何理解微软的行为?是否因为在微软的生态下,商业化更容易实现? A:AI有三个阶段,1)一档时代:单点阶段,语音识别,人脸识别,车牌识别 、手写体识别、OCR识别等,2)二档时代:多个技术的组合,在工业、医疗等场景解决问题,;3)三档时代:颠覆入口和内容。 l颠覆入口:颠覆交互方式,搜索的入口变革(敲命令行——微软用视窗颠覆,鼠标实现所见即所得——Google搜索框——苹果(154.500,3.680,2.44%)触屏 ),AI会继续做变革,在语音、视觉、自然语言变革之后,以助理的方式解决问 题。微软拥抱很合理,应用很直接,对于入口的颠覆意愿很强,减少了用户自行选择信息的方式,有助理来收纳整理,“颠覆者”的动力最初最强。后期“被颠覆者”的动力也会逐步增强,比如苹果,目前滑屏搜索比较便捷,如果有更便捷的方式问世,也会相应拥抱新技术。 l颠覆内容:AIDC,以丰富、更个性化的方式来生成内容。 因此,微软拥抱chatGPT很合理,应用很直接;苹果在Siri上做加强也是不错的应用,;mask作为OpenAI的创始投资人,也可能会迭代到bot上。 Q:云从科技等A股计算机公司受疫情影响,招标、实施有所延期,今年随着投资的增强、科技产业的复苏,是否在逐步复苏?目前港股、四小龙、AI公司春节期间表现较好,今年的发展趋势和节奏如何?大模型的预训练、chatGBT、AIGC的底层算法的发展是否对业务有中长期促进? A:技术:1)坚持投入,在正确赛道上长期布局。AI的未来发展一定会对场景和产业形成效率和体验的全面提升,长期会坚持数据结合知识的趋势,坚持整个大模型、预训练、下游任务迁移的逻辑,自2020年便在预训练、业务迁移上 ,视觉、语音、NLP的大模型上持续加大投入,沿袭chatGPT的范式。2)倡导人机协同,NLP已经被人类高度抽象过,处理难度相对较少;而视觉、语音堆数据达到的成果会更难,属于原始数据,处理难度更大,后续会需要更多人的参与。3)技术平台化、应用场景差异化:要从Tier3逐步走到Tier1,逐渐成为AI平台公司,不能只做平台,也要在行业做一些落地,一方面是用行业Know-how提升算法模型水平;另一方面形成范式,后期与第三方的公司和合作伙伴一起使用时,形成更好的生态。 业务:1)ToG业务在2022年受疫情影响,招投标延迟、预算减少、规模减小 ;今年政府明确在新基建等方面加大投入,前期未招的标会后续落实,业绩有保障;2)ToB业务加强布局,随着AI在ToB行业解决问题增多,标准化程度上升,可复制性变强,公司在ToB行业业绩的增速也会较为可观;3)数字人在ToB和ToC业务会有更大应用空间。 Q:今年在ToB上主要哪些行业会有订单落地?销售价格、收入确认节奏如何 ? A:最大行业是金融,目前来看比2022年增速有明显提升。金融的应用场景快速变多,除了IT,存贷汇的业务里也引入数字人,此类订单快速释放;确认节奏比较好,项目周期不太长,回款有保障。 其他行业:智能制造、医院等行业有大量需求,底层逻辑上有良好通用性,对发展速度比较有信心。 Q:政府上主要落地的业务? A:AI赋能数字城市治理,大逻辑有三个部分:1)数据要素:是政府未来重要资助方向,各地数交所和大数据平台在部署,公司正在与多地政府和云从沟通如何通过AI能力打通、为数据赋能,并且公司是科技部和发改委的国家的开放平台;2)提升智慧治理水平:数据金融屋,城市管理、应急管理等;3)当地支柱产业的智能制造:也在与政府沟通合作,提升制造业水平。 Q:今年的业绩预测、净利率指引?A:今年业绩增速相较2022年会有较大的提升。Q:ChatGPT是否会拉动算力资源的提升?目前中国算力能否满足? A:算力分为训练侧和推理侧,训练侧只有AI公司需要大量数据和算力来做支撑,一次算力耗费1亿人民币,但是次数相对有限,公司数目也相对有限;推理测,如果广泛在生活中应用,每个人需要的助理以10个计,每个数字人/实体机器人需要一套算力支撑计算,按中国的人口规模来算会非常大。 前期主要是科技公司训练,算力部署足够;当场景落地且普及,肯定会大范围扩建。 Q:ChatGPT产生的新应用在哪几个场景会更多? A:目前没有一个模型能完全打通视觉、语音和自然语言理解的模型,几千亿的数据不足以描述视觉和语音。ChatGPT最有价值的是范式,未来视觉、语音模型等可以参考。 需要用自然语言问答的场景会对ChatGPT更迫切,比如搜索引擎。如果未来几年将多个逻辑结合,不受逻辑限制,能打通线上和线下,打通实时和非实时,助理的形式对应的空间会完全不同。 云从会从ToG、ToB的多个应用场景,通过算法效果和平台通用化后的综合技术能力,在政府、工业、金融领域提升业务、降本增效,逐渐渗透得对行业进行改造,是您前面讲的一个问题。 第二个问题就是你问他最后的范式会是少数公司占据,还是逐渐会更多的公司来做这件事?哈,这个也是取决于我们讲的什么模型。如果是一个通用的聊天机器人,在这一块上面,它需要有一个大的模型做基础,可能就是几千亿个参数。首先会有几个大公司来发布,但是通用的大模型,它其实不能解决我刚才讲的各个场景里面的专业的问题。所以它会有一系列的,也是要中等规模的一些基础公司来对做,把场景的Lo耗,刚才讲的训练,再次训练,或者是教练模型跟它进行结合,会有一系列的中等规模的公司来一起来做这件事情。 Q:百度3月底会发类似的模型,未来会形成怎样的格局?是由几个公司来发布通用型工具吗?云从科技是不是也会发布类似的? A:最后的范式会是少数公司占据还是更多的竞争者格局,取决于是什么模型 。如果是通用的聊天机器人,需要几千亿个参数,会有几个大公司发布通用大模型,在具体场景上需要中等规模公司借助行业Know-how来做。但是对于语音和视觉模型,需要专业的公司,不会因为有了通用大模型就降低门槛,Tier1 -3都不会降低门槛,只会降低最上层场景应用的门槛。 Q:高算力上是否会被美国卡脖子?中国算力上是否有担心?A:会有一定影响,但不是决定性的影响,核心企业的算力不会因此无法训练 ,会增大使用成本,但是AI属于颠覆性技术,不会因为成本问题不发展。另一 方面,中国芯片未来也会同步发展。 Q:与商汤、依图、旷视等的优势和差别? A:AI赛道很广,AI是技术而非产业,类似互联网,形成竞争的会是搜索、电商领域,AI可能性很多,会各自赋能各行各业。依图做AI芯片,旷视做AIOT,而云从做人机协同操作系统,打通逻辑,从Tier3做到Tier1,以数字人作为灵魂,赋能各个场景