近期ChatGPT成为全球热议话题,我们认为AIGC的商业化应用将极大推动各行各业发展。我们联合电子组展开“AI+终端应用”系列研究,作为系列开篇,本篇围绕智能交互平板行业展开,智能交互平板有望与AIGC在教育和会议场景中深度绑定,提升产品结构及行业渗透率。 ChatGPT与GPT4.0使AI商业化初步落地,AI的“iPhone时刻”来临。OpenAI团队推出的GPT(生成式预训练语言模型)从1.0到4.0的发展可谓超神演化,通过“预训练+微调”使得大模型显著降低AI工程化门槛。2022年11月ChatGPT问世,与之前几代的区别在于加入了RLHF(人类反馈强化学习)训练模式,ChatGPT对人类意图的理解已经达到非常高的程度。2023年3月GPT4.0发布,与上一版本相比最大特点是出现了多模态应用。事实上AI技术并非新鲜事物,为何此次ChatGPT的推出能够引发全球轰动?我们认为其核心是ChatGPT代表着AI正在从感知智能向认知智能发展,代表了通用人工智能突破的可能性,正是“通用性”使得AI的“商业化”能够初步落地,“AI的iPhone时刻”已经来临。 AIGC应用集中于数字化程度高、内容需求丰富的行业。目前AIGC典型的应用是利用自然语言描述作为输入,涵盖多个交互领域,生成各种模态的数据。 具体可分为:文本生成、音频生成、图像生成、视频生成等,覆盖传媒、影视、电商、医疗以及金融等各行各业。AI的应用对于各类行业的赋能程度有所差异,其中:1)此前人力所不能及、AI能带来颠覆性或创新性变革的行业最为受益——例如打破游戏行业的“不可能三角”、以及直接替代人工的虚拟人行业,而这将极大促进会议助手、远程教育、远程医疗、影视娱乐等领域发展,由此,也将直接利好消费电子和智能家居产品的渗透率提升与产品升级;2)通过AIGC应用实现降本增效、节省费用类的行业受益性次之——例如AIGC将重塑办公、电商、营销领域生产力和创新力。 智能交互平板赋能会议、教育场景,天然适配ChatGPT,也是微软Copilot的重要硬件入口。智能交互平板(IFPD)近年来全球出货量稳步增长,2022年全球出货量372万台,同比增长22.8%。其中教育类平板受益于教育贴息政策需求有望迎来第二春,会议类平板全球渗透率仅约3%仍有长期提升空间,创新类产品如健身镜、美妆镜百花齐放。IFPD符合会议高效化、智能化的趋势,微软Copilot及其他AIGC应用赋能交互平板后将对传统会议和教学模式形成颠覆性的差异,产品渗透率有望迎来提升拐点。我们认为未来会议、教育类IFPD与人工智能技术有望深度融合,将成为AI落地应用的重要形式之一。 落地到品牌,我们认为,优先受益的智能交互平板品牌或将具备以下特点:1)与微软、Google、OpenAI等海外大厂有历史合作关系的企业将占据直接先发对接优势;2)由于API接口优先在海外落地,有为海外品牌代工生产的企业、或直接贴牌授权海外销售的企业更占优势;3)国内互联网大厂也正积极推出本土AI大模型,与国内大厂有历史合作关系的、处于行业头部具备品牌声量的企业或更具优势。基于以上,推荐创维数字,并建议关注视源股份、康冠科技、鸿合科技、海信视像、四川长虹。 风险提示:AI应用落地不及预期,教育信息化政策落地不及预期,成本大幅波动风险。 重点公司盈利预测、估值及投资评级 投资主题 报告亮点 本篇报告系统梳理了GPT发展历程,落地说明了ChatGPT与历代的差异性与重要性,并总结了AIGC在各行业商业化应用的可能。我们认为AI未来在会议助手、远程教育、远程医疗、影视直播、在线客服等领域可能替代人工,由此,将直接利好智能交互平板、智能音箱、智能机器人等消费电子和智能家居终端设备的渗透率提升与产品升级。 落地到终端,我们联合电子组展开“AI+终端应用”系列研究,探讨受益于AI的各类终端产品。作为系列开篇,本篇报告围绕智能交互平板行业展开,智能交互平板作为搭载相关操作系统的终端产品,有望与AIGC在教育和会议场景中深度绑定,提升产品结构及行业渗透率。 投资逻辑 ChatGPT的出现代表着AI正在从感知智能向认知智能发展,意味着通用人工智能突破的可能性,正是“通用性”使得AI的“商业化”能够初步落地,“AI的iPhone时刻”已经来临。具体到AI的应用,我们认为此前人力所不能及、AI能带来颠覆性或创新性变革的行业将最为受益——例如将催生直接替代人工的虚拟人行业迅速发展,而这将极大赋能会议助手、远程教育、远程医疗、影视娱乐等行业,由此,也将直接利好消费电子和智能家居产品的渗透率提升与产品升级。 智能交互平板赋能教育、会议场景,天然适配ChatGPT,也是微软Copilot的重要硬件入口。未来会议、教育类IFPD与人工智能技术有望深度融合,将成为AI落地应用的重要形式之一。我们认为优先受益的智能交互平板品牌或将具备以下特点:1)与微软、Google、OpenAI等海外大厂有历史合作关系的企业将占据直接先发对接优势;2)由于API接口优先在海外落地,有为海外品牌代工生产的企业、或直接贴牌授权海外销售的企业更占优势;3)国内互联网大厂也正积极推出本土AI大模型,与国内大厂有历史合作关系的、处于行业头部具备品牌声量的企业或更具优势。基于以上,推荐创维数字,并建议关注视源股份、康冠科技、鸿合科技、海信视像、四川长虹。 近期ChatGPT成为全球热议话题,由此展开的关于AIGC概念的探讨层出不穷。我们认为,AIGC的商业化应用将极大推动各行各业发展,在会议助手、远程教育、远程医疗、影视直播、在线客服等领域有可能直接替代人工,由此,将直接利好智能交互平板、智能音箱、智能机器人等消费电子和智能家居终端设备的渗透率提升与产品升级。 我们联合电子组展开“AI+终端应用”系列研究,探讨受益于AI的各类终端产品。作为系列开篇,本篇报告围绕智能交互平板行业展开,智能交互平板作为搭载相关操作系统的终端产品,有望与AIGC在教育和会议场景中深度绑定,提升产品结构及行业渗透率。 一、AI开启新一轮科技革命,商业化应用已初步落地 (一)AIGC的发展历程 AI被视为“第四次科技革命”,开启新一轮技术创新周期。人工智能概念最早于1956年被提出,多年以来产业历经几轮技术爆发周期。2012年AlexNet神经网络模型问世,成为一轮发展起点,并开启了AI在各行各业的应用,被视为人工智能1.0时代,但当时仍存在模型碎片化等问题。2017年Google团队提出的Transformer架构,开启了大模型为主流算法的人工智能2.0时代,模型参数呈现指数级增长。自2018年起,新一代AI技术正在开始全新一轮的技术创新周期,而GPT也正是由此时诞生。 GPT1.0-4.0的超神演化历程梳理:从2018年起,OpenAI开始发布生成式预训练语言模型GPT(Generative Pre-trained Transformer),这系列模型可以在复杂的NLP任务中取得惊艳效果,例如文章生成,代码生成,机器翻译,Q&A等,GPT仅需要非常少的数据便可以理解任务需求,并接近或者超过目前最高的技术水平,这是因为GPT模型的训练需要超大的训练语料,超多的模型参数以及超强的计算资源,通过提升网络的参数数量来完成GPT系列的迭代更新。GPT的发展证明了通过不断提升模型容量和语料规模,模型的能力可以不断提升。 图表1 GPT发展历史 1、从GPT-1到GPT-3:证明海量参数训练可行性 在GPT出现之前,NLP(自然语言处理)模型主要是使用监督学习针对特定任务进行训练。存在的限制是:大规模高质量的标注数据不易获得;模型仅限于所接受的训练,泛化能力不足;无法执行开箱即用的任务,限制了模型的落地应用。 GPT-1诞生于2018年,GPT-1只能算得上语言理解工具而非对话式AI,其常用任务包括:1)自然语言推理:判断两个句子的关系(包含、矛盾、中立);2)问答与常识推理:类似多选题,输入为1个文章1个问题及若干答案,输出为每个答案的准确率;3)语义相似度识别:判断两个句子语义是否相关;4)分类:判断输入文本是指定的哪个类别。 GPT-1存在明显的数据局限性和泛化能力不足的问题。GPT-1是在互联网上的书籍和文本上训练的,对世界的认识不够完整和准确;GPT-1在未经微调的任务上的泛化能力远远低于经过微调的有监督任务。 图表2早期NLP模型与GPT-1特点及局限性 2019年推出的GPT-2,与GPT-1并没有本质上的不同,最大贡献是验证了随着模型容量和数据量的增大,模型能力有进一步开发的空间。GPT-2最大模型共计48层,参数量达15亿。性能方面,除了理解能力外,GPT-2在生成方面表现出强大天赋:除阅读摘要、聊天、续写、编故事外,甚至具备生成假新闻、钓鱼邮件或在网上进行角色扮演等能力。 基于GPT-2的验证,2020年迭代的GPT-3是里程碑式的飞跃。GPT-3较上代并没有太大结构上的差异,之所性能优异是因为海量参数量的训练。GPT-3相比较GPT-2训练的参数量从15亿跃升至1750亿,提高约117倍,数据量也达到了45TB。 性能方面:GPT-3几乎可以卓越完成自然语言处理的绝大部分任务;它不需要微调,可以识别数据中隐藏的含义,并运用此前训练获得的知识来执行任务。哪怕从来没有接触过的示例,GPT-3也能理解并提供不错的表现,因此GPT-3在商业应用上表现极高稳定性和实用性。 GTP-3局限性:最主要问题是它只会找不同问题之间的相关性,但它并不了解用户真实想要的答案是什么,且无法长期对话下去。 图表3 GPT-3迭代实现里程碑式突破 2、InstructGPT与ChatGPT:跨越性的“iPhone时刻” InstructGPT也被称为GPT3.5(ChatGPT的前身)与GPT-3的主要区别在于,新加入了RLHF(Reinforcement Learning from Human Feedback,人类反馈强化学习)。这一训练范式增强了人类对模型输出结果的调节,并且对结果进行了更具理解性的排序。 ChatGPT和InstructGPT均使用RLHF训练,区别在于训练数据的设置方法不同。之前的InstructGPT模型,是一个输入对应一个输出,再跟训练数据对比,对了有奖励不对有惩罚;现在的ChatGPT是一个输入,模型给出多个输出,然后人类给输出结果排序,让模型学习人类排序的方式。简单来讲:ChatGPT模型训练在以下两点: 模仿人类制定的偏好,训练老师模型。通过ChatGPT和OpenAI开源的API,GPT得到越来越多的问题,GPT对问题输出多个答案,OpenAI雇佣很多人类老师给GPT的多个答案打分,人类老师不需要告诉GPT标准答,GPT通过这些数据训练一个模仿人类老师打分标准的老师模型。 用增强式学习向模型老师学习。GPT将输入的问题和它返回的输出的答案,给到老师模型,老师模型已经学会了人类的喜好(如,老师模型知道输入是个问句,输出如果是问句就给低分,因为用户肯定是希望得到一个答案),他会给GPT的输出打分,帮助GPT模型训练。用老师模型代替人类打分,减少人工成本。 图表4雇佣人类打分训练老师模型 图表5老师模型代替人类打分 对比之前所有的训练模型,ChatGPT对人类意图的理解达到了非常高的程度。对话轮次的提升是结果,根本的原因是它更理解了人类的意图,并且不断地去给用户对的回复,具体体现:ChatGPT敢于质疑不正确的前提;主动承认错误和无法回答的问题;大幅提升了对用户意图的理解;大幅提升了结果的准确性。 图表6 ChatGPT主要特点 ChatGPT在特定领域和成本端仍有局限性。特定领域上,在其未经大量语料训练的领域缺乏“人类常识”和引申能力,且无法处理复杂冗长或者特别专业的语言结构,如金融、医学等专业领域的问题;成本端,因其需要非常大量的算力(芯片)来支持其训练和部署,成本是企业和用户需要考虑的问题;无法在线的把新知识纳入其