AI智能总结
GPT-4横空出世,实为多模态算法 GPT-4于北京时间2023年3月15日横空出世,是OpenAI算法里程碑的代表作,为多模态大型语言模型。相较于GPT-3.5的相同点为:1、训练过程可预测下一单词;2、训练集为网上公开数据预料库;3、采用强化学习和人工反馈;不同点为:1、OpenAI团队开发了基础设施和优化,使模型的计算量大幅降低;2、加入了额外的奖励模型(RBRM)即安全奖励信号,来减少有害的输出;因此相较于GPT-3.5,模型引发不良行为的生成已大幅降低。 GPT-4功能强大,已经具备“人类思维” 1、模型更加强大,更可靠、更有创意、且更能够理解细微的指令,例如在各种专业考试中取得优异成绩;2、文章理解、语义理解能力更强 ,例如总结和加工文章,GPT-4相较于GPT3.5更有优势;3、GPT-4不仅仅是语言模型,而是多模态融合模型,GPT-4可以具备“人类思维”并理解“图片的内容”并进行反馈,比如考试题推理、纸质摘要、图像分析、图像描述等功能。4、具备极强的复杂推理机制;5、多种语言方面均表现出优越性;虽然GPT-4功能强大,但仍有不足,GPT-4推理结果并不完全正确,但相较于前一版本已准确率明显上升。 GPT4.0的一小步,通用AI的一大步 GPT-4.0是具有人类水平表现的大型多模态模型,且目前大型语言模型领域,模型表现能力较强,我们认为GPT-4代表的AI正向着具有安全部署的通用型人工智能迈进一大步。同时,GPT-4仍为API接口收费,价格相比于GPT-3.5更贵。此外我们认为,大模型出世,算法和算力缺一不可,根据量子位消息,微软斥资几亿美元,为训练ChatGPT打造超级电脑,其中包括上万张英伟达A100芯片。 投资建议: 我们认为AIGC的出世会产生革命性的影响,同时有望赋能千行百业。我们梳理了三条路径图,积极的推荐以下三条投资主线: 1)具备算力基础的厂商,受益标的为寒武纪、海光信息、浪潮信息、中科曙光、景嘉微、龙芯中科、神州数码、拓维信息; 2)具备AI算法商业落地的厂商,重点推荐科大讯飞、拓尔思,其他受益标的为:海天瑞声; 3)AIGC相关技术储备的应用厂商,受益标的为:百度、同花顺、三六零、金山办公。 风险提示 核心技术水平升级不及预期的风险;AI伦理风险;政策推进不及预期的风险;中美贸易摩擦升级的风险。 1.GPT-4震撼发布, AI算法之巅 1.1GPT-4横空出世,实为多模态算法 GPT-4横空出世,实为多模态算法:2023年3月15日,北京时间凌晨,Open AI公布了GPT-4算法,是OpenAI扩展深度学习的最新里程碑式的结果,GPT-4时为大型多模态模型(接受图像和文本输入,发出文本输出),虽然目前在许多现实场景能力依旧不及自然人,但是在许多专业考试和学术基准上依旧表现出不俗能力,我们认为从已知算法来说,GPT-4为AI大模型又一跨越里程碑式的巨作。 GPT-4是一个多模态大型语言模型:即支持图像和文本输入,以文本形式输出扩写能力增强,能处理超过25000个单词的文本;更具创造力,并且能够处理更细微的指令。此外,微软也表示,新Bing正在运行GPT-4。 多模态算法同样具有跨时代的意义:多模态算法即融合文字、图片、音视频等多种内容形式的AI算法,多模态出世之前,AI模型只专注于单一领域,例如自然语言处理或计算机视觉等;多模态技术出现后,模型已经从早期单一的自然语言处理和机器视觉发展成自动生成图画、图像文字、音视频等多模态、 跨模态图型,极大的推动了AIGC的内容多样性和通用性。 训练过程:GPT-4与以往的相同点为:1、训练过程可以预测文档的下一个单词;2、数据训练集为网上公开的数据语料库(包括数学问题的正确和错误解决方案、弱推理和强推理);3、与GPT-3.5相同,同样采用了强化学习和人工反馈(RLHF)可以理解成在“人脑思维”的基础上加入了“人类反馈系统”。 而GPT-4与以往的不同点:其一,OpenAI团队开发了基础设施和优化,通过可拓展性的方法进行模型的推断,使模型的计算量大幅降低。 其二,加入了额外的奖励模型(RBRM),即安全奖励信号,来减少有害的输出。 该模型的思路为奖励由GPT-4零样本分类器提供,该分类器根据安全相关提示判断安全边界和完成方式,通过数据标记的方式(具有正值或负值)来鉴定安全边界。 因此相比于GPT-3.5模型相比,GPT4.0有效增添了许多安全特性,敏感性的输出内容大幅降低。 GPT-4极大降低的引发不良行为生成的概率:从内容来看,最终GPT-4相较于早期的GPT-4模型的不良行为的生成已经大幅降低,但是仍然存在,根据OPEN AI官网介绍,未来,公司有望与外部人员合作,通过评估的方式来尽可能的降低模型引发不良行为的概率。 1.2GPT-4功能强大,已经具备“人类思维” 1、GPT-4相较于GPT-3.5模型更加强大,更可靠、更有创意、且更能够理解细微的指令,表现出来的性能为,在各种专业和学术考试以及NLP(自然语言处理)基准测试上达到或超越人类水平。例如,GPT-4在模拟律师资格考试上取得了前10%左右,相比之下,GPT-3.5的得分在倒数10%左右,此外在众多考试中,GPT-4已经达到较高水平。 第二,在文章的理解上,GPT-4的能力更加强大,语义能力理解能力更强,文本的加工和总结能力更强,模型可以更“具备拟人化的能力理解语义”,例如文章总结,根据产品发布会,GPT-4可以非常完美的完成此项任务,GPT-3.5可能甚至没有尝试,就放弃任务(对于GPT-3.5如果是非常生硬的文章,也许可以成功)。 第三,GPT-4最具有跨越性意义在于,GPT-4不仅仅是一个语言模型,而是多模态的融合模型,具体而言,GPT-4可以灵活的接受任意图像和文本的输入,从而回答客户想要的答案并进行描述,同时GPT-4允许用户指定任何视觉或语言任务。 例如下图而言,GPT-4可以具备“人类思维”并理解“图片的内容”并进行反馈,比如考试题推理、纸质摘要、图像分析、图像描述等功能。 第四,GPT-4具备极强的复杂推理机制,无论是复杂的逻辑推理、编程推导或者是密集型内容帮助,GPT-4皆表现能力不俗,例如ChatGPT可以帮助税务人士进行密集的内容帮助,该模型快速得到了标准答案,并且可以做到“理解它的解释”。 因此我们认为,GPT-4有望对编程、内容审核等场景产生深远影响。此外,GPT-4能够处理超过25000字的文本,允许用长形式的内容创建、扩展会话、文档搜索和分析。 第五,多种语言方面均表现出优越性。根据OpenAI官网数据,在测试的26种语言中,GPT-4在24种语言方面的表现均优于GPT-3.5等其他大语言模型的英语语言性能。其中GPT-4的中文能够达到80.1%的准确性,而GPT-3.5的英文准确性仅为70.1%,GPT-4英文准确性提高到了85.5%。 尽管GPT-4.0功能强大,但是仍有不足:GPT-4的推理并不是完全正确的,结果依旧不完全可靠,但相比于以前而言,这种错误的出现的概率明显降低,在OpenAI内部对抗性真实性评估中,GPT-4的得分比我们最新的GPT-3.5高40%。 其原因分为以下两点:1、GPT-4普遍缺乏对绝大部分数据(2021年9月中断后)发生的事件的了解;2、GPT-4模型预测中存在错误,原因可能为校准相对减少。 1.3GPT4.0的一小步,通用AI的一大步 GPT4.0的一小步,通用AI的一大步,具体而言:GPT-4.0是具有人类水平表现的大型多模态模型,且目前大型语言模型领域,模型表现能力较强 , 因此我们认为GPT-4代表的AI正向着具有安全部署的通用型人工智能迈进一大步。 此外,GPT-4仍为API接口收费:目前GPT-4目前仅像ChatGPT的付费用户开放,同时也会作为API提供给企业及开发者,开发者需进入候补名单上;根据techweb数据,GPT-4 8k长度版本收费为,请求收费为0.03美元/1000token,回复收费为0.06美元/1000token,GPT-4 32k长度版本的收费为请求收费为0.06美元/1000token,回复收费为0.12美元/1000token,而GPT-3.5收费为0.002美元/1000token(请求相应相同)。 我们认为大模型的横空出世,算法与算力缺一不可:ChatGPT的背后与算力密不可分,根据量子位消息,微软斥资几亿美元,为训练ChatGPT打造超级计算机,其中包括上万张英伟达A100芯片,甚至为此调整了服务器架构。 2.投资建议 我们认为AIGC的出世会产生革命性的影响,同时有望赋能千行百业。我们梳理了三条路径图,积极的推荐以下三条投资主线: 1)具备算力基础的厂商,受益标的为寒武纪、商汤、海光信息、浪潮信息、中科曙光、景嘉微、联想集团、紫光股份、龙芯中科、神州数码、拓维信息; 2)具备AI算法商业落地的厂商,重点推荐科大讯飞、拓尔思,其他受益标的为:海天瑞声; 3) AIGC相关技术储备的应用厂商,受益标的为:百度、同花顺、三六零、金山办公。 3.风险提示 1、核心技术水平升级不及预期的风险; 2、AI伦理风险; 3、政策推进不及预期的风险; 4、中美贸易摩擦升级的风险。