微软或将ChatGPT应用于Bing,有望带来搜索引擎革新。据外媒TheInformation报道显示,微软可能会在2023年3月之前在Bing中应用ChatGPT,用人工智能来回答一些搜索查询。若Bing引入ChapGPT,有望以完整句子的形式呈现搜索结果,这一举措或将改变搜索引擎的运行模式,革新性地提升搜索引擎效率。 OpenAI此前发布ChatGPT,算法突破令人瞩目,泛AI应用有望加速。2022年12月,OpenAI发布了NLP(自然语言识别)新模型ChatGPT,一经面世就举世瞩目。该模型是使用简单,只需向ChatGPT文字提出需求即可,可完成回答问题、书写代码、写诗、写小说等任务,效果惊人。我们认为,随着ChatGPT带来的算法突破,NLP能力上限有望持续攀升,在机器人、智能语音/视觉、AIGC、智能公文写作等领域有望不断落地,不断拓展泛AI技术在现实生活中的应用范畴。 1)人形机器人:ChatGPT助力人机互动能力升级,加速算法落地。NLP技术带来的人机交互能力是人形机器人的刚需,尤其是面向C端场景。2022年10月,Tesla已经发布了Optimus人形机器人的原型机,而它需要配合算法形成软硬件综合协同方能应用。我们认为,ChatGPT有望提升人形机器人的人机交互能力,加速人形机器人使用体验升级。 2)AI语音语义:NLP技术持续优化。NLP被视为AI皇冠上的明珠,对话式AI与知识图谱带动产业规模增长,到2026年国内NLP带动相关产业规模可破千亿。 我们认为,ChatGPT的算法突破带来了NLP技术上限的进一步提升,有望加速NLP技术在千行百业的应用。 3)AI视觉:AIGC方兴未艾,而图像识别技术已进入落地阶段,有望受到催化进一步迭代。1)AIGC技术方兴未艾,这种基于AI的人工智能创作有望革新未来的内容生产方式,而NLP能力是其生产力的重要组成部分,ChatGPT有望加速其技术迭代。2)另一方面,AI图像识别技术已进入广泛落地阶段,以海康威视、大华股份为首的领军企业已将技术应用于G端安防、B端工业/文旅等领域,协助各个领域降本增效。 投资建议:建议关注1)AI视觉:海康威视、萤石网络、大华股份、云从科技。 2)机器人:三花智控、绿的谐波、鸣志电器、双环传动;3)AI语音语义:科大讯飞、拓尔思、汉王科技。 风险提示:AI技术迭代不及预期风险;人形机器人未来销量不达预期风险;经济下行超预期风险。 1.微软欲用ChatGPT扶持必应,ChatGPT是否是AI的革命? 微软有望在Bing中使用ChatGPT,通过AI回答部分搜索查询。据外媒The Information最新发布的一篇报道显示,微软可能会在2023年3月之前在Bing中应用ChatGPT,用人工智能来回答一些搜索查询。这一举措有望改变搜索引擎的运行模式,进一步提升搜索引擎效率。 若Bing引入ChapGPT,有望以完整句子的形式呈现搜索结果。The information的报道,早在2019年,微软在对OpenAI的投资中就包括了一项将GPT的某些方面纳入Bing中的协议。具体来看,旧版本的GPT可以在用户输入时,自动提供搜索查询建议。如今,微软已经宣布计划将Dall-E 2模型集成到Bing Image Creator中,方便用户可以在其中发出描述性文本提示并生成AI图稿。若是Bing引入ChatGPT聊天机器人,这些AI支持的答案可能会以包含信息来源的完整句子的形式呈现,而不是引用可能解决用户提出的问题来源或者链接列表的精选片段。不过,根据报道,“Bing仍将依靠自己的技术来产生大部分搜索结果”,因为GPT并不意味着“像搜索引擎那样持续抓取网络或提供实时信息”。同时,Bing如何确保答案的准确性还有待观察。The Information称这“可能会在今年3月底之前推出”,而Bing可能被定位为“免费访问部分GPT的唯一方式”。 ChatGPT或有望打破传统搜索引擎格局。相比传统的搜索引擎根据用户提问,从而提供数千万个相关链接索引,ChatGPT直接提供自己的搜索和信息综合的单一答案,让用户省去反复点击链接找寻答案的复杂度。若能过实现落地应用,ChatGPT会面向传统搜索引擎发起挑战。 不过,ChatGPT在搜索引擎领域的应用当前仍具有几大悬而未决的掣肘: 1)真实性无法保证。在学术、科研等严谨的应用场景中,ChatGPT提供的答案并不一定都是正确的。解决ChatGPT输出的真实性将会是一项重大的挑战,由于ChatGPT只提供纯文本,不引用实际网站,目前并没有办法从ChatGPT的输出中分辨真伪,除非用其他来源(如Google)来验证答案。 2)信息的实时性难以保证。搜索引擎的索引其实可以实时更新,也更为方便快捷一些,但对于大型语言模型而言,添加新的内容需要重新训练模型,成本昂贵。据外媒报道,基于GPT3.5,ChatGPT可能至少有1750亿个参数。由于没有可以适合该模型的单个硬件,因此必须将其分解并分布在多个处理器上,例如A100GPU。设置和并行化这些处理器以训练和运行模型既是技术挑战,也是财务挑战。 3)商业模式问题。目前,ChatGPT还处于测试阶段,并没有落地的商业模式。不过此前据TechCrunch估计,拥有100万用户的ChatGPT每天花费100,000美元,每月花费约300万美元。若应用于Bing后经历高频度的搜索查询,商业运营成本极高。 但总体而言,ChatGPT的出现,有望带来各个领域运营模式的革新,即使目前尚未铺开,但有望为未来应用打开全新的可能性。 2、ChatGPT算法突破,泛AI发展有望加速 OpenAI此前发布ChatGPT,新一代对话式NLP模型取得令人瞩目的算法突破。 2022/12/1,OpenAI发布了NLP(自然语言识别)新模型ChatGPT,一经面世就引发科技界的巨大关注。该模型是OpenAI基于先前推出的NLP预训练模型GPT-3.5之上的衍生产品,利用AzureAI超级计算基础设施、通过有人类反馈的加强学习方法训练而成。 ChatGPT,从其名字就可知,这是一个对话式的AI模型(chat在英文中是聊天之意),使用简单,只需向ChatGPT文字提出需求即可。ChatGPT可完成回答问题、书写代码、写诗、写小说等,对完成用户指令的响应度远强于两代前的GPT-3。马斯克在推特上评价ChatGPT称:“ChatGPT好得惊人。我们离强得可怕的AI不远了。” 图表1:马斯克在推特盛赞ChatGPT ChatGPT可用于完成多种用户提问需求,例如回答问题、写代码、写诗等。 1)回答问题:只需键入提问后回车,系统将自动输出回答。 图表2:ChatGPT可回答提问 2)写代码:系统在通过问答确定用户需求后,将直接输出代码。 图表3:ChatGPT可用于自动输出代码 3)写诗:输入要求,系统可自动输出诗句(不过ChatGPT目前仍不具备押韵能力)。 图表4:ChatGPT可以写诗 4)书写更长段落的文字:比如小说。 图表5:ChatGPT可以生成小说 通过有人类反馈的加强学习(RLHF)训练,ChatGPT能够更好地理解用户指令。ChatGPT使用RLHF(ReinforcementLearningfromHumanFeedback)训练了一个初始模型:人类AI训练员提供对话,他们在对话中扮演双方——用户和AI助手,AI训练员可以访问模型编写的对话回复,以帮助AI调整回复内容。为了创建强化学习的奖励模型,该研究需要收集比较数据,其中包含两个或多个按质量排序的模型回复。该研究收集了AI训练员与聊天机器人的对话,并随机选择一条模型编写的消息,抽取几个备选回复,让AI训练员对这些回复进行排名。此外,该研究还使用近端策略优化算法(PPO)微调模型,并对整个过程进行了数次迭代。由于训练过程中加入了人类反馈,有别于前代GPT-3单纯使用海量数据的训练方法,ChatGPT能够更好地理解用户指令,并作出反应。 图表6:ChatGPT使用RLHF方法进行训练 相比过去的人机对话模型,ChatGPT表现显著更优,能给出更具体的回答,并且可以直接完成详细指令,甚至主动驳回一些危险提问。ChatGPT模型比以往的人机对话模型(例如GPT3等)更强大,例如,其敢于质疑不正确的前提和假设、主动承认错误以及一些无法回答的问题、主动给拒绝不合理的问题、提升了对用户意图的理解以及结果的准确性。与之前的GPT3不同,相比于此前海量学习数据进行训练,ChatGPT中,人对结果的反馈成为了AI学习过程中的一部分。初次之外,ChatGPT甚至会主动驳回一些危险提问,例如:如果提问“如何霸凌John”,上一代的模型InstructGPT会给出几种方法作为解答,而ChatGPT给出的答案则是“霸凌是不对的”。 图表7:ChatGPT会主动驳回一些具有潜在道德风险的危险提问 我们认为,随着ChatGPT带来的算法突破,NLP能力上限会日益提升,有望在人机交互、智能客服、语音对话、AIGC、智能公文写作、机器人等领域持续落地,不断拓宽泛AI技术在现实生活中的应用。 3、机器人:ChatGPT有望助力人机互动能力升级 2C场景,基于NLP的人机交互能力是人形机器人的刚需。在面对C端用户时,人形机器人由于其仿人的形态特征,需要人机交互能力作为指令接收的入口。而在人机交互能力中,NLP能力无疑是重中之重,人形机器人需要能够听得懂人类的指令,才能进一步去完成各类任务,基于NLP的人机交互能力是人形机器人的刚需。 特斯拉Optimus人形机器人原型机已于2022年10月发布,并在上海进博会上首次面向公众展出。2022年10月1日,特斯拉在AIDay上发布了Optimus人形机器人的原型机,并于2022/11/5在上海进博会上展示了实物。现场展示的是已经安装外壳的二代机,虽然由于出厂时间短尚未将行走功能训练成熟,现场展示版本直立静止,但已经具备较高的完成度,现场播放视频显示原型机已经可以完成搬运物品、浇花等动作。这是TeslaBot首次面向公众展出,为后续B端、C端落地打下基础。 图表8:上海进博会现场展示的特斯拉人形机器人 二代版本训练时间短未能行走,组合动作及手部动作惊艳。装有外壳的最新版本(二代机Optimus),该版本刚出厂不久未得到充分训练,现场未展示其行走功能但视频展示了四肢组合运动及手部组合精细运动,指关节快速进行了1、2、6、握拳等动作,展示了高精度与高灵敏度,给未来功能迭代提供了极大想象空间。 图表4:现场视频展示了TeslaBot手部精细度 以AI算法为核心的运动迭代展现开创性思路,5个月时间从艰难移步到脚离地快速行走。在特斯拉之前,本田ASIMO与波士顿动力机器人等其他人形机器人问世已久,能够实现的功能大体为直立行走、挥手、握手、搬运物品、拧瓶盖等。而根据特斯拉发布会官方说明,特斯拉Optimus开发至今仅六个月,却已经能基本实现直立行走、挥手、给植物浇水、搬运盒子等算法功能,平衡性及移动速度大幅提高仅用时4个月,软件迭代高效。当前,由于二代机面世仅一个月,尚未调试完全;但我们预计二代机在落地后能在应用中快速学习,实现技术的快速进步与迭代。 图表9:机器人共享汽车自动驾驶算法 图表10:平衡性及移动速度大幅提高仅用时5个月 机器人是超越版的智能手机,仅有硬件无法应用,需要配合软件算法形成综合协同。 1)统一的硬件是机器人作业的基础,要求的是高精度、高灵敏度、高力矩,以最大限度地满足不同活动对机器人活动的要求。2)而机器人的功能实际上则由综合算法来实现,需要智能感知能力、运动控制能力、感控一体技术、AI算法等软硬件能力的综合配合。 一言以蔽之,硬件是机器人的躯体,软件是机器人的灵魂,软硬综合、灵肉结合,才能形成完整可用的智能机器人。3)特斯拉机器人的产品迭代过程及大量算法、软件发布显示,软件生态进步才是推动目前机器人应用场景实现的关键要素。