您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[西南证券]:计算机:GPT-4专题-构建模型理解能力,商业落地未来可期 - 发现报告
当前位置:首页/行业研究/报告详情/

计算机:GPT-4专题-构建模型理解能力,商业落地未来可期

信息技术2023-03-30王湘杰西南证券李***
计算机:GPT-4专题-构建模型理解能力,商业落地未来可期

GPT-4专题 构建模型理解能力,商业落地未来可期 西南证券研究发展中心计算机团队王湘杰2023年3月 核心要点 AI大模型持续演进,GPT-4理解能力大幅提升。2022年11月30日,OpenAI发布ChatGPT,5天后即达到100万用户,是历史上用户增长最快的应用程序。2023年3月15日,OpenAI发布GPT-4,GPT4相比ChatGPT基于的GPT-3.5模型,其在多模态、理解能力、角色认知、长文本支持方面有了明显进展。我们认为,无论从应用上的用户增长,还是在模型上的能力提升方面,均具备极大优势。 AI大模型加速应用升级,AIGC有望对多个行业带来颠覆式创新。2023年2月8日,微软正式将ChatGPT引入Bing,3月17日微软宣布其正在将基于GPT-4的AI技术植入Office办公软件中,标志着以GPT-3.5和GPT-4为代表的大模型开启了办公和搜索新方式,我们认为,未来AI大模型的发展和推广将率先带来游戏、代码编码、生命科学3个行业的变革。此外,多模态将赋能生成式AI,在文本、音频、图像和视频等场景实现商业化落地,软件端和硬件端有望迎来新机遇,其中,我们将重点关注大模型对工具类软件和多场景的赋能,在工具侧有望带来以CAD、EDA、ERP为主的工具类软件的估值重构。 GPT-4引发海量算力需求,把握算力产业链机会。根据测算,我们认为,在中性假设下,ChatGPT一年产生的API调用费用约为6.2亿美元,与此同时,ChatGPT将在训练和推理层面对GPU产生巨大需求。根据OpenAI公开信息,GPT-3.5模型的API价格为0.002美元/千token,而GPT-4在请求方面的API价格为0.06美元/千token,回复方面为0.12美元/千token,以0.06美元/千token计算,GPT-4的API调用成本是GPT-3.5的30倍以上,算力相关需求有望翻倍增长。 投资建议:1)大模型相关标的:微软(MSFT.O)、谷歌(GOOG.O)、百度(BIDU.O)等海内外大厂;2)算力相关标的:联想集团(LNVGY.OO/0992.HK)、英伟达(NVDA.O);3)应用端相关标的:网易(9999.HK)、阅文集团(0772.HK)、创梦天地(1119.HK)。 风险提示:大模型进展不及预期风险、市场竞争加剧风险、AI应用的道德伦理风险、商业模式变现与落地不及预期风险、下游需求不及预期风险。 1 目录 1模型演进:AI大模型能力不断强化,GPT系列模型持续迭代 1.1ChatGPT:基于GPT-3.5模型构建,成为史上用户增长最快应用 1.2GPT-4:更强大的多模态大模型,关注理解能力的构建 2应用落地:大模型加速AGI实现,GPT-4推动模型进入可实用时代 2.1AGI:全球加速布局,AGI成为未来重点发展方向 2.2GPT-4具体应用:多领域初步试水,商业化落地未来可期 3关注方向:AIGC产业链完善,把握四层架构及海内外受益主体 四层架构:数据层—算力层—模型层—应用层 4海外相关标的 2 1模型演进:AI大模型能力不断强化,GPT系列模型持续迭代 AI之路:从AI1.0到AI2.0再到AGI,能力越来越强,使用越来越简单,结果越来越可控。 AI1.0AI2.0AGI 【单个任务的专用模型】 为每一项任务开发一个模型 需要针对具体任务进行微调 开发周期长、投入资源高 微调了什么能力,则具备什么能力,不会出现“涌现”能力 例如:基于规则、统计、大模型 Bert、GPT2等模型的引擎 【广泛任务的通用模型】 一般用提示词调动相关能力 (zero-shot) 可对长上下文(如32K字符)进行建模,具备超强多轮对话能力 由于“涌现”能力、思维链和简 单推理,可具备处理未见过的任 务的能力 例如:GPT3.5、ChatGPT等 【通用人工智能AGI】 更加强大的提示词和“涌现能力 ”以应对新的任务 对结果具备可解释性和具备不断自我学习能力 对能力和结果可控,符合人类伦 理和社会规范 例如:未来不断发展的模型及未 来其他更新的模型。 GPT系列模型演进:GPT-4是OpenAI发布的最新GPT系列模型,作为大规模多模态模型,它可以 接受图像和文本输入,产生文本输出,是目前最强的文本生成模型。 2018.06 2019 2020.05 2022.01 2022.11 2023.03 【GPT-1】 1.17亿参数 有一定泛化能力,可接下有任务微调 【GPT-2】 15亿参数 生成能力突出,包括聊天、续写、摘要 【GPT-3】 1750亿参数 上下文小样本学习能力强大,可完成大多数NLP任务 instructGPT 1750亿参数 指令微调,不真实/有害化/无用回复减少 【chatGPT】 约1750亿 基于人类反馈数据,对齐人类喜好 ,强大意图 理解能力 【GPT-4】 万亿级别 数据源扩充 ;增加训练后处理和行为预测;幻觉问题下降 资料来源:大语言模型和资产管理论坛,西南证券整理3 1.1ChatGPT:基于GPT-3.5模型构建,成为史上用户增长最快应用 ChatGPT简介:由OpenAI研发的AI技术驱动的自然语言处理工具,于2022年11月30日发布。 GPT—GenerativePre-trainedTransformer(生成预训练变换器),是openAI推出的一种用于处理自然语言文本大型神经网络模型。ChatGPT基于GPT-3.5模型构建、使用Transformer架构,通过连接大量的语料库来训练模型,在GPT大模型能力的加持下,ChatGPT对于文本、任务的理解能力有了新的飞跃,能根据聊天的上下文进行互动,做到与真正人类几乎无异的聊天场景进行交流。在聊天场景以外,ChatGPT还能完成撰写邮件、视频脚本、文案、翻译、代码等任务。 ChatGPT发展历程 时间 事件 2022年11月底 人工智能对话聊天机器人ChatGPT推出,迅速在社交媒体上走红,推出5天,注册用户数超过100万 2023年1月末 ChatGPT的月活用户已突破1亿,成为史上增长最快的消费者应用 2023年2月2日 美国人工智能公司OpenAI发布ChatGPT试点订阅计划——ChatGPTPlus。ChatGPTPlus将以每月20美元的价格提供,订阅者可获得比免费版本更稳定、更快的服务,及尝试新功能和优化的优先权 2023年2月2日 微软官方公告表示,旗下所有产品将全线整合ChatGPT,除此前宣布的搜索引擎必应、Office外,微软还将在云计算平台Azure中整合ChatGPT,Azure的OpenAI服务将允许开发者访问AI模型 2023年2月7日 微软宣布推出由ChatGPT支持的最新版本人工智能搜索引擎Bing和Edge浏览器。微软CEO表示,“搜索引擎迎来了新时代”;8日凌晨,在华盛顿雷德蒙德举行的新闻发布会上,微软宣布将OpenAI传闻已久的GPT-4模型集成到Bing及Edge浏览器中 资料来源:百度百科,讯飞易听说,西南证券整理4 1.1ChatGPT:基于GPT-3.5模型构建,成为史上用户增长最快应用 ChatGPT在发布5天后即达到100万用户,是历史上用户增长最快的应用程序。 根据UBS发布的研究报告,ChatGPT在2023年1月的月活用户数已经超过1亿。 各应用达到100万用户所需时间 各应用达到1亿用户所需时间(单位:月) ChatGPT Instagram SpotifyDropboxFacebookFoursquare Twitter Kickstarter AirbnbNetflix 5Days 2.5 Months 5Months 7Months 10 Mont1h3s Months 2Years 2. 2. 3.5 ChatGPT 2 TikTok 9 Instagram 30 WhatsApp 42 Meta 54 Spotify 54 Twitter 5Years 5Years Years90 资料来源:WorldofEngineering,TRTWORLD,西南证券整理5 1.1ChatGPT:基于GPT-3.5模型构建,成为史上用户增长最快应用 ChatGPT工作原理: ChatGPT使用的GPT-3.5模型包含大量的语言数据,当用户输入问题时,GPT-3.5模型会根据语言数据生成回答候选集,并从中选择最佳回答,ChatGPT再将生成的回答以自然语言的形式输。 ChatGPT在基础语言模型的基础上,通过RLHF(从人类反馈中强化学习)训练,使用户的反馈可以即时反馈到模型上,形成自我学习能力,根据新数据不断迭代更新。 ChatGPT工作原理 模型训练过程主要分三步:1)收集提示信息和人工形成的任务示例,通过监督学习训练模型。2)将初始模型用在新的对比数据上,生成多个输出,人工对这些输出进行排序,排序结果用于训练奖励模型。3)使用PPO(ProximalPolicyOptimization)深度强化学习算法训练奖励模型。 资料来源:上游新闻,稀土掘金技术社区,腾讯云开发者,西南证券整理6 1.2GPT-4:更强大的多模态大模型,关注理解能力的构建 GPT-3.5 GPT-4 一图看懂GPT-4新变化 自然语言处理模型 1.模型升级 多模态模型 文字问答 2.功能升级 看图作答文字问答数据推理 剧本写作 分析图表角色扮演 3000字 3.文字输入长度 25000字 司法考试排名倒数10% 4.考试能力 司法考试排名前10% SAT数学考试590分 SAT数学考试700分 生物奥林匹克竞赛排名前69% 生物奥林匹克竞赛排名前1% $0.002美元/1000token (请求响应相同) 5.API价格 请求$0.06美元/1000token回复$0.12美元/1000token 6.其他升级 英文准确度提升到85.5%;中文准确性提升80.1%;事实准确性大幅提升 7.GPT-4落地应用 Bing(提供制定化搜索服务)、Bemyeyes(帮助盲人看世界)、 Duolingo(帮助纠正语法错误)、可汗学院(为学生提供虚拟导师)… 资料来源:OpenAI,西南证券整理7 1.2.1GPT-4:更强大的多模态大模型,关注理解能力的构建 更庞大的参数->更昂贵的算力-> 更中心化的服务模式-> GPT4 <-图形能力更强 <-更稳定的表现 <-更强大的知识处理能力 过去计算机只能“模拟”,GPT-4可以“理解”,更关注理解能力的构建。过去模型一定需要针对具体问题进行具体设计,如果表述不够“结构化”,模拟效果难以保证。现在GPT-4拥有理解能力,因此也带来了逻辑推演的能力,有更好的悟性,能应用于更多场景。MMLU,MassiveMaxLanguageUnderstanding,达到86.4%(57个题),GPT3是70%。 GPT-4多个核心理解能力提升 主要能力 GPT-4的新功能和改进 文本理解能力 GPT-4对上下文和语义的理解能力增强,能够生成更准确、相关和连贯的响应,降低产生无关或无意义文本的可能性。 多语言理解功能 GPT-4扩展语言库,支持更广泛的语言,提高流畅度,使其更加通用,更容易被世界各地用户访问。 实时适应能力 GPT-4学习和适应的能力使其能够提供更好的定制化响应,更具吸引力和个性化的互动。 图像理解能力 GPT-4理解图像能力增强,可以通过运用最先进的计算机视觉技术,从图像中提取关键元素和上下文,将功能提升到基于文本的交互之外。 规则理解能力 能最大限度地减少有害和不真实的输出,但由于对遵守规则有了更好的理解,GPT-4将拒绝比3或3.5模型更多的请求。 复杂任务的理解能力 GPT-4在更复杂、更细微的任务处理上,回答更可靠、更有创意,能够处理更复