您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[中航证券]:人工智能行业六问六答,“AI+应用”投资框架 - 发现报告
当前位置:首页/行业研究/报告详情/

人工智能行业六问六答,“AI+应用”投资框架

信息技术2023-04-16-中航证券甜***
人工智能行业六问六答,“AI+应用”投资框架

数字经济专题报告 2023年4月16日 六问六答:“AI+应用”投资框架 行业评级:增持 中航证券社会服务团队 分析师:裴伊凡 证券执业证书号:S0640516120002邮箱:peiyf@avicsec.com 中航证券研究所发布证券研究报告请务必阅读正文后的免责条款部分 目录 一、为什么ChatGPT爆火? 二、GPT产品的演绎路径? 三、AIGC的底层技术驱动? 四、AIGC如何重构内容生产力? 五、看好“AI+”哪些应用场景? 六、如何把握“AI+”时代的投资机遇? 产品介绍:ChatGPT是一个基于语言模型GPT-3.5的聊天机器人,由美国人工智能公司OpenAI推出的一款对话式AI模型。 它会通过连接大量的语料库来训练模型,这些语料库包含了真实世界中的对话,使得ChatGPT具备上知天文下知地理,还能根据聊天的上下文进行互动的能力,做到与真正人类几乎无异的聊天场景进行交流; ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。实际应用上,ChatGPT等文本AI可能帮助文本创造类行业完成智能内容生成,并一定程度上替代搜索引擎。 对话式AI模型 语言理解 文本生成 聊天 ChatGPT 代码 诗词 脚本 文案 翻译 邮件 …… 图表1:ChatGPT使用场景展示 ChatGPT接入插件功能,打造AI生态帝国:美东时间3月23日,OpenAI宣布解除了ChatGPT无法联网的限制,以第三方插件为中介,使ChatGPT能访问其他网站并获取实时信息,还支持执行计算,第一批插件由Expedia、OpenTable、Shopify等公司提供,这些插件的具体功能包括推荐餐厅、制定出游计划、网上商店购物、企业办公、信息检索、语言教学等,涵盖日常生活的衣食住行各个方面。 用户增速创历史记录:2022年11月30日,OpenAI发布了ChatGPT,5天注册用户数就超过100万。瑞士银行巨头瑞银集团的一份报告显示,在ChatGPT推出仅两个月后,月活用户已经破亿,成为史上用户增长速度最快的消费级应用程序。OpenAI预测,公司在2023年预计营收2亿美元,在2024年将达到10亿美元。 商业变现模式:2023年2月2日,ChatGPT推出付费订阅版本,每月收取20美元(约合135RMB),让订阅者获得比免费版本更稳定、更快服务,尝试GPT-4功能等。 图表2:ChatGPT已接入插件展示图表3:ChatGPT更为史上最快活跃用户破亿的应用 ChatGPT的应用场景多元:ChatGPT潜在的市场规模是空前的,能够覆盖各个领域,包括自然语言处理、对话系统等六个方面。借助其强大的算力和算法分析, ChatGPT有望在教育、科研、游戏、新闻等多个领域发挥作用,并不断拓展其市场潜力。 图表4:ChatGPT的应用举例 教育 科研 游戏 新闻 IT 游戏 营销 ……... 自动化写作 •利用预设的模板、关键字或信息,帮助用户自动生成各种类型的文本。 信息检索 •类似于搜索引擎 •精准匹配内容 语言翻译+语言模型 •不同语言之间翻译 •单词、短语、句子预测 文本生成 •自动生成文章 •自动生成摘要 •自动生成评论 对话系统 •回答用户提出的问题 •提供相关信息 •帮助用户解决问题 自然语言处理 •语义分析 •情感分析 •实体识别 对话式AI模型 ChatGPT 目录 一、为什么ChatGPT爆火? 二、GPT产品的演绎路径? 三、AIGC的底层技术驱动? 四、AIGC如何重构内容生产力? 五、看好“AI+”哪些应用场景? 六、如何把握“AI+”时代的投资机遇? 人工智能算法的迭代推动AIGC的发展:几十年来,AI领域持续探索,1940-1980s符号AI占主导,1980年后,统计AI与神经AI齐头并进,二者竞争发展至今,GPT系列属于神经AI。 符号(Symbolic)AI:二十世纪80年代以前属于符号AI时代,开启了以知识建模算法、专家系统算法为代表AI早期发展阶段; 统计(Statistical)AI:1985年的贝叶斯网络和1995年的SVM是20世纪机器学习发展的两大标志,但近年来,逐渐成为非主流的研究方向; 神经(Neural)AI:经历了1980s-2012年神经网络、2012年后的深度学习两大阶段,深度神经网络和模型大小呈正相关,伴随着模型参数量的增加,相对应深度神 经网络的能力将大幅提升,GoogleBrain的Transformer和OpenAI的GPT系列都属于深度学习领域的代表作。 SymbolicAI •将人类专家的知识和经验转化为计算机可以理解的形式,并利用AI技术来实现 •手写规则,简单粗暴 •只能处理非常少量数据 •像人脑一样学习 •开始尝试大量数据 •提前标注数据 •应用于计算机视觉、自然语言 处理、语音识别等领域 1985至今1980s-20122017 GPT系列 •基于Transformer架构 •投喂海量学习数据 •无监督训练方法 •通用文本预训练 2018 1970-1980s •找到一些函数或参数 •分类固定量数据 •应用于数据分析、预测 和分类等任务 机器学习 StatisticalAI •全注意力机制 •关注文本序列数据 整体注意力 Transformer 知识建模、专家系统 图表5:ChatGPT的应用举例 神经网络 NeuralAI 神经人工智能 深度学习 GPT系列的迭代发展,造就了ChatGPT的诞生,初代的ChatGPT为GPT-3.5架构的产物,现仍在持续进化升级。 GPT的定义及发展:GPT是一种基于Transformer架构的生成型预训练变换模型(GenerativePre-trainedTransformer),用于解决NLP任务,可预测给定文本下一个单词的概率分布,以生成人类可理解的自然语言。从算法模式的版本上,已经迭代到GPT-4,其在某些方面的性能“可与人类相媲美”,并在大学入学和法律及医学等专业领域的许多模拟考试中优于其前身GPT-3.5。 ChatGPT是已经经历了GPT-3.5到GPT-4的过渡,多模态功能推出,已成为深度学习领域的旷世佳作。从GPT-1到GPT-4,它的功能越来越全面,表现也越来越类人,与2018年第一版GPT1.17亿的参数相比,GPT-3.5拥有着1750亿的参数量,GPT-4预计参数量或破万亿,这极大程度提升了GPT的运行规模,让GPT开始能完成一系列令人难以置信的任务。 图表6:GPT系列产品升级情况 模型 发布时间 参数量 Transformer模型层数 解码器数 预训练数据量 技术介绍 GPT 2018.06 1.17亿 12 12 约5GB 无监督学习,从而对高质量标注数据的要求比较低,有比较强的泛化能力(在没有见过数据的zero-shot中表现更稳定)。 GPT-2 2019.02 15亿 48 48 40GB 多任务学习,验证了通过海量数据和大量参数训练出来的词向量模型有泛化使用而不需要额外的训练。 GPT-3 2020.07 1750亿 96 96 45TB 海量参数,从而在无样本或极少量样本情况下完成下游NLP任务,还可以完成数学加法、代码编写等任务。 GPT-3.5 2022.11 - - - - 使用RLHF(ReinforcementLearningfromHumanFeedback,基于人类反馈的强化学习)技术,可以进行连续对话。 GPT-4 2023.3 约10000亿 - - - 一种更加高效、准确和灵活的自然语言生成模型 ChatGPT核心技术主要包括其具有良好的自然语言生成能力的大模型GPT-3.5/4以及训练这一模型的钥匙——基于人工反馈的强化学习(RLHF)。 GPT3.5建立在3.0的微调之上。据OpenAI披露,GPT-3已有1750亿参数训练,GPT3.5/4在此基础上参数量可能再创新高。2022年4月至7月,OpenAI开始对code-davinci-002模型进行Beta测试,其可能是最强大的针对自然语言的GPT-3.5变体,ChatGPT就是从code-davinci-002进行指令微调得到的。此后ChatGPT在2022年11月发布,使用的基于人类反馈的强化学习的版本指令微调模型。 图表7:大模型参数量迅速增长图表8:GPT3-GPT3.5的演变过程 GPT-3采用无监督学习机制。优点在于无需人工进行数据标注,可以节省模型训练成本,模型泛化能力更强,经过少量样本训练,就可以看到准确度显著提升。 加入人类反馈强化学习,GPT3.5/4获得对话能力。①定义及优缺点:RLHF无需提前对训练数据进行标注,而只需要人工对模型输出的结果进行评分,虽然需要消耗一定的人力,但是模型结果会更加符合人类偏好;②GPT-4训练模型:GPT-4的训练与GPT-3.5类似,包括SFT的预训练、基于RLHF的奖励模型训练和强化学习的PPO算法微调,不同的是使用了基于规则的奖励模型(RBRM),在PPO微调期间向GPT-4提供额外的奖励信号。 图表9:训练模型由GPT-3的无监督学习,进化到GPT-3.5/4的人工反馈的强化学习 3月15日,OpenAI发布了ChatGPT的最新“升级版本”——GPT4模型,OpenAI在官网表示,GPT4是一个能接受图像和文本输入,并输出文本的多模态模型,是OpenAI在扩展深度学习方面的最新里程碑。GPT4的语言理解和生成能力均超过了ChatGPT,可以解答ChatGPT无法完成的问题,同时GPT4可以描述并理解图片。 视觉识别能力:GPT-4视觉识别能力突出 •文本理解和图像识别并行:GPT-4可以接受文本和图像的提示,允许用户指定任何视觉或语言任务。在一系列域(包括包含文本和照片的文档、图表或屏幕截图) 上,GPT-4表现出与纯文本输入类似的功能。 •辨别幽默元素:除了能够识别图像内容,GPT-4还能辨别图像中存在的幽默元素,并做出相关解释。 图表10:GPT-4视觉识别相关案例 用户:我可以用这些原料做什么? GPT-4:你可以用这些原料做很多选择!一些可能性包括:煎饼或华夫饼、可丽饼、法式吐司、煎蛋卷或菜肉馅煎蛋饼、乳蛋饼奶油冻或布丁、蛋糕或纸杯蛋糕松饼或面包、饼干。 这些只是几个例子,但可能性是无穷无尽的! 用户:这张图有什么好笑的?一个面板一个面板地描述它。 GPT-4:该图显示了带有三个面板的“LightningCable”适配器的包装。面板1:带有VGA连接器(一种大的蓝色15针连接器,通常用于计算机显示器)的智能手机已 插入其充电端口。面板2:“Lightning Cable”适配器的包装,上面有VGA连接器的图片。面板3:VGA连接器特写,末端有一个小型闪电连接器(用于为iPhone和其他Apple设备充电)。 这张图片中的幽默来自将过时的大型VGA连接器插入小型现代智能手机充电端口的荒谬做法。 图表12:GPT-4在英语测试中优于现有语言模型(准确率) 85.5% 67.0% 69.3% 70.1% 25.0% 语言能力:语言测试中GPT-4完胜其他大模型(Chinchilla,PALM)。 •英语测试中,GPT-4的准确率为85.5%,高出第二名15pct,取得碾压优势; •除英语外的26种语言测试中,GPT-4在24种的准确率获胜,包括拉脱维亚语、威尔士语、斯瓦希里语等资源匮乏的语言,准确率集中在70%-85%,虽与其他模型相比优势突出,但未来仍存在较大提升空间。 •文字输入限制大幅提升,由基于GPT-3.5的ChatGPT的3000字限制提升至GPT-4的25000字,用户使用将开拓更多使用场景。 图表11:GPT-4文字输入限制提升至2.5万字随机猜测C