您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国盛证券]:ChatGPT应用第三次展望 - 发现报告
当前位置:首页/行业研究/报告详情/

ChatGPT应用第三次展望

信息技术2023-03-12刘高畅国盛证券枕***
ChatGPT应用第三次展望

基础模型+细分领域微调,GPT可落地千行百业。预训练大模型相对通用,通过结合细分领域数据与KNOW-HOW,大模型可以针对垂直领域做微调优化,在各行各业落地。相比细分领域模型,使用基础模型做细分领域数据微调具备极大优势,效果上基础模型通用性高,并且预训练的无监督数据获取难度低;微调基础模型的行业效果更好,在各领域应用中可以不断学习专业数据提升基础模型。 输入输出信号多模态,是大模型改变物理世界的关键。多模态是AI真正全面渗透各行各业的必经之路,也是通用人工智能实现的关键。即使在单一模态应用上,多模态模型的能力也往往比单模态模型更强。微软,谷歌等大厂相继推出多模态大模型KOSMOS-1和PalM-E562B,微软德国首席技术官透露GPT4或为多模态大模型。展望未来,大模型的输入输出信号会走向多模态,可能是图像、视频甚至机器人决策指令,潜在应用空间更广泛。 产业节奏展望:现阶段主要用于搜索及聊天机器人,1-5年内简单多模态应用,5-10年内用于复杂问题决策。我们认为,多模态GPT落地应用速度将会很快,国内有望复现类似模型并快速在细分场景使用。1)现阶段,大模型主要用于搜索、航程辅助、聊天机器人变种(猎头使用软件、智能客服,智能音箱、游戏NPC等); 2)1-5年内,会用于Office类工具,简单多模态方案(智能家居、工业视觉、行业化机器人)、行业专家(医疗、教育等)、智能助理(即时、工作安排、点外卖、购物等);3)5-10年内,会用于复杂多模态方案(通用机器人、虚拟现实)等。 现阶段AI赋能:智能办公最先落地,类聊天机器人应用快速产生。智能办公领域,微软已经宣布将ChatGPT与其低代码应用平台Power Platform应用,并且微软首席执行官纳德拉或将于3月16日举办的在线活动中,展示类似ChatGPT的人工智能如何在Teams、Word和Outlook等Office生产力套件中发挥作用。在智能家居领域,ChatGPT有望助力智能家居产品渗透率提升,而其中智能音箱是重要抓手,随着ChatGPT提高智能音箱交互体验,有望使得智能音箱从非刚需产品逐步转型为家庭必备产品。在智能电商领域,智能客服可为商家提升效率。未来随着人形机器人发展,人类将走向通用人工智能时代。 建议关注: 算力及数据公司:中科曙光、海光信息、拓维信息、常山北明、浪潮信息、寒武纪、景嘉微、工业富联、光通信产业链。 核心技术公司:百度、阿里、华为、科大讯飞、360、海天瑞声、云从科技、拓尔思、腾讯、字节跳动等。 应用:1)对标微软办公:金山办公;2)多模态(输入输出信号变化):大华股份、海康威视、当虹科技、万兴科技、新国都、中科创达、泽宇智能。3)互联网传媒:汤姆猫、昆仑万维、立方数科、中文在线、蓝色光标、利欧股份、视觉中国。4)智能音箱:漫步者、国光电器。5)国内巨头合作或场景型公司:光云科技、同花顺、宇信科技、高伟达、方直科技、寺库、知乎、神思电子、汉王科技。6)医疗应用:嘉和美康、卫宁健康、润达医疗、药石科技。7)通过CHATGPT写代码提升效率:赛意信息、润和软件、法本信息等一系列软件公司。8)机器人:三花智控、鸣志电器、绿的谐波、晶品特装。 风险提示:AI技术迭代不及预期风险;经济下行超预期风险;行业竞争加剧风险。 1、基础模型在细分领域微调 基于预训练大语言模型GPT3.5加入监督数据微调得到的ChatGPT,在对话、写作等多方面的优秀表现,掀起了预训练大模型的浪潮。 所有大模型的训练都分为两步:通用性的预训练(pre-training),形成预训练大模型,或称为基础模型(Foundation Model),然后针对特定领域做微调(fine-tuning)。通过这种过程,原则上来说只要有细分领域数据,大模型就可以针对垂直领域做优化,可在各行各业落地,充满无限可能。目前,OpenAI已经向用户提供上传数据微调模型的付费服务。 图表1:AI从训练到落地应用流程 图表2:OpenAI微调模型价格表 相比细分领域模型,使用基础模型做细分领域数据微调具备成本和效果两方面的优势。 1)成本优势主要可以模型搭建成本以及数据获取成本两方面考虑。一方面如果每个细分领域完成不同的任务都需要从头搭建和训练一个模型,而使用预训练的基础模型做微调,在规模效应下会显著降低模型的落地成本。一方面基础模型可以大量使用获取成本较低的公开数据、无监督数据用于预训练,学习海量数据中的知识和逻辑,在微调时只需要少量获取成本较高的细分领域高质量标注数据。另外,拥有基础模型的厂商,在对接众多下游应用的过程中,也会积累工程上的经验,形成日益完备的解决方案。 2)效果优势也可以从当前大模型的效果和未来提升空间两方面考虑。首先预训练基础模型+专业数据微调往往能表现地比单一领域训练的数据效果更好,这点在ChatGPT上就能体现,之前NLP各领域有不同模型,而现在ChatGPT在对话、翻译、写作甚至写代码等任务上都表现出了更好效果。其次基础模型相对单一领域模型,能力提升空间更大,如果一个厂商推出的基础模型效果好,在使用细分领域数据微调做细分应用时,获取的数据可以反哺自己的基础模型,不断提升自己的基础模型能力,而基础模型的能力越强,便越会加速应用到更多领域,产生正向循环。 2、多模态快速发展,结合大模型带来更多应用场景 众多科技巨头争相推出多模态模型。2月27日,微软推出KOSMOS-1模型,能够感知图片、文字等不同模态输入,并学习上下文,根据给出的指令生成回答。3月6日,谷歌推出palm-E模型,以将真实世界的连续传感器模态直接结合到语言模型中,输入是多模态语句,交织了视觉、连续状态估计和文本输入编码,可以执行多种具体任务,包括机器人操作规划、视觉问题解答等。并具备能与数据集中不存在的物体交互的泛化能力。 GPT4将是多模态模型,德国媒体Heise报道称。3月9日,微软德国首席技术官Andreas Braun在活动中透露,GPT4或将在下周推出,并且将是一个多模态模型,会提供完全不同的可能性—例如支持视频。此外,之前DALLE2、Stable diffusion等多模态AI绘画模型在AIGC领域也有出色表现。我们相信,伴随着多模态大模型的不断涌现,更多场景的AI应用将会加速落地。 图表3:KOSMOS-1可以接受多模态输入,学习上下文信息,进行推理和回答 图表4:PaLM-E操控机器人将绿色块推到海龟,机器人之前没见过海龟 AI要渗透到各行业,向多模态发展是必然趋势。各个应用场景需要交互的输入输出各不相同,例如AI绘画从输入图像或者文字得到图像,PalM-E同时处理视觉、语言和传感器,极可能应用到工业生产。同时多模态的大模型也可以通过细分领域数据微调,高效地应用到各个领域。 多模态还是实现通用人工智能(artificial general intelligence,AGI)的关键。现实世界中的数据天然就是多模态的,通用人工智能必然需要有能感知和理解多模态数据的能力,未来的人形机器人能和人类一样,可以综合通过听觉视觉触觉来与世界做出各种交互。 我们认为,模型学习不同模态的数据,可以相互促进不同模态的理解能力,使得多模态模型比单一模态效果更好。微软的论文中在图像分类等任务上测试KOSMOS-1和一些单模态模型对比得到了更好的效果。这个观点还可以从ChatGPT的能力来源上做推理,首先ChatGPT通过学习有强逻辑性的代码数据,得到了对话中更强的推理能力,其实可以认为代码和自然语言就是不同的模态,其次从更狭义的角度来讲,我们可以认为不同语言就是不同模态,ChatGPT只学习了非常少量的中文,但是已经可以在中文对话上得到很好效果,这是因为其他语言中也包含了对话的逻辑,ChatGPT在学到其他语言中的逻辑后,可以运用到中文上。我们认为这种跨语言的学习能力,在跨模态上也能体现。 3、产业节奏展望 现阶段,大模型的能力还主要体现在NLP上,因此主要用于搜索(如微软继承了大模型的New Bing)、航程辅助、聊天机器人变种(猎头使用软件、智能客股,智能音箱、游戏NPC等)。 1-5年内,随着多模态的发展,大模型首先会用于Office类办公工具,还将有多类简单多模态方案落地(智能家居、工业视觉、行业化机器人)、行业专家(AI医疗、教育等)、智能助理(聊天、工作安排、点外卖、购物等)。 5-10年内,结合复杂多模态方案的大模型将具备完备的与世界交互的能力,在通用机器人、虚拟现实等领域得到应用。 4、下游应用 下游第三方生态应用:巨头合作大幕快速展开。在众多第三方生态合作厂商中,我们建议关注:1)背靠微软、谷歌、百度等核心大模型技术大厂进行合作,以及2)具备适合大模型落地的细分场景与数据的企业。 大模型能落地的具体应用场景十分广泛,包括并不限于以下场景。 4.1AI办公:落地最快的领域之一,AI赋能智能办公 AI办公是大模型最快落地的领域之一。据机器之心消息:3月7日,微软宣布将ChatGPT的技术扩展到其Power Platform平台上,这将允许用户在很少甚至不需要编写代码的情况下,就能开发自己的应用程序。另外微软将于3月16日举办一场名为“The Future of Work with AI”的在线活动,首席执行官纳德拉或将展示类似ChatGPT的人工智能如何在Teams、Word和Outlook等Office生产力套件中发挥作用。在国内,2021年07月22日,金山办公在珠海举办首届技术开放日,分享了WPS的AI中台能力,并同步发布KSAI-lite开源框架,将办公领域的先进AI技术向业界开放。 图表5:微软宣传语“Give the power of AI to everyone” 4.2智能家居:AI赋能智能家居,AI音箱率先受益 AI技术进步有望助力智能家居产品渗透率提升,而其中智能音箱是重要抓手。当前,智能音箱已完成初轮用户普及,成为智能物联重要端口。ChatGPT推动智能音箱体验升级,有望使智能音箱从非刚需产品逐步转型为家庭必备产品。交互能力更强的ChatGPT有利于提升智能音箱反馈丰富程度以及准确性,对于用户意图的理解更加智能,从而改善用户的使用体验。目前已经有工程师尝试用ChatGPT改变智能家居体验,高级Web开发人员Mate Marschalko利用ChatGPT结合Siri Shortcuts制作更智能的语音助手。 MateMarschalko通过语言发出命令“我正在昏暗的办公室中录制视频,你能帮我做些什么吗?”,ChatGPT语音助手回答“为你打开灯。”,并进行了开灯操作。同时,ChatGPT+智能音箱能够提供情感陪伴,其强大的上文关联能力以及学习能力,使得智能音箱可以根据用户的个人喜好和使用习惯,提供个性化的建议和服务,延伸至情感陪伴功能。 图表6:利用ChatGPT结合Siri Shortcuts制作语音助手 4.3AI电商:大模型赋能电商环节,智能客服提升效率 大模型有望为光云科技等电商企业赋能,助力智能客服。光云科技为阿里系电商SaaS服务商,目前旗下拥有以超级店长、快递助手、旺店系列为核心的中小商家电商SaaS产品。光云科技已经推出了专为电商打造的客服机器人快智小麦。展望未来,若阿里推出类ChatGPT模型,有望赋能光云科技,提升智能电商客服的能力。 图表7:光云科技为阿里系SaaS公司 4.4人形机器人:迈向通用人工智能时代 特斯拉Optimus人形机器人原型机已于2022年10月发布,并在上海进博会上首次面向公众展出,已经能基本实现直立行走、挥手、给植物浇水、搬运盒子等算法功能,平衡性及移动速度大幅提高仅用时4个月,软件迭代高效。ChatGPT有望助力人机互动能力升级,多模态的发展也将助力机器人交互现实世界的能力,相信随着大模型能力提升以及硬件发展,未来人形机器人彻底改变整个人类社会的生产生活方式。 图表8:上海进博会现场展示的特斯拉人形机器人 5、投资建议 建议关注: 算力