AI最新里程率,GPT-4发布,3月14日,OpenAI发布GPT-4:是个 大型多模态模型(接受图像和文本抢入,发出文本抢出),实现了以下 几个方而的飞跃式提升:1)强大的识图能力;2)宇数限制提升至2.5万 宇,回答准确性量落提高;3)能够生成歌词,创意文本,实现风格变 化;4)在冬神专业和学术基准上表现出人类水平的表现、例如,它通迁 GPT-3.5的得分约 了模抵律师考试,分数约为考生的前10%;相比之下,( 为例数10%,相比GPT3.5,GPT-4在复杂任务能力、事实性,可操纵 性和安全性等方而都有了巨大提升。 多模态是GPT-4最大光点,多模态是AI真正全面渗逢各行各业的必经 之路,电是通用人工智能实现的关健。GPT-4的最大突驶就在于支持多 模态,可以输入图片和文本,允许用户指定任何视受或语任务。在一-系列类型的输入上(包括包含文本和照片的文档、图表或屏靠或图) 上,GPT-4部有优秀表现。 GPT提供通用、逻辑与智能,模型微调与多模态构成万物互联基础,大模型相对通用:通过结合细分额领域数据微调:可以针对垂直额域微微调 优化,结合多模态的发展,大模型可以使用现实中各领域的不同模态输 入的出数据进行徽调,优化出功能多样的多模态模型,在各行各业落 地,构成万物互联的基础, 应用节泰展望:现阶段主要用于捷索及天机器人,1-5年内简单多模态 应用,5-10年内用于复杂问题决策,我们认为,多模态GPT落地应用速 度将会很快,国内有望复现关似模型并快建在细分场景健用,1)现阶段, 大模型主要用于投索、航程辅助、聊天机器人变种(精头用软件、智能 客服,智能产箱、游戏NPC等):2)1-5年内,会用于Office类工县 简单多模态方策(智能家居、工业视党、行业化机器人)、行业专家(医 旁、教育等)、智能助理(即时、工作安祥、点外卖、购物等);3)5-10 年内,会用于复录多模态方案(通用机器人、虚拟现实)等。 建议关注: 核心应用:大华股份、海康点规、云从科技、 工具:万兴科技、当虹科技、 潜力场景:中科创达、新国都、方直科技,创维数宇。 风险提示:AI技术造代不及预期风险;经济下行超预期风检;行业竞争加 S 2023年03月15日 1、GPT-4介绍 3月14日,OpenAI发布GPT-4,是一个大型多模态模型,在各种专业和学术基准上 表现出人类水平的表现。例如,它通过了模拟律师考试,分数约为考生的前10%,相比 之下,GPT-3.5的得分约为例数10%,OpenAI花了6个月的时间选代GPT-4,使得GPT- 4在事实性、可操纵性和拒绝“越获”命今等方面取得了有史以来最好的结果,OpenAI 还开源了他们的AI模型性能自动评极架OpenAIEvals. GPT-4的主要进步有以下几方面: GPT-4支持多模态。给定由穿指文本和图像组成的愉入,GPT-4生成文本愉出(自然语言、代码等), 贾表上:GPT4回苹国片中的的肌表自子于种一小性时的大谨换易插入一个小型现代雪腔手机充电口的范学 User Soros.nmm/Reda GPT-4 Panel t: A smartphone with a VG.A connector (a large, blue, 15-pin connector typically used for computer monitors) plugged into Its charging port. and other.Apple devices) at the end. The humor in this image comes from the absurdlity of plugging a large, outdated VGA connector into s small, modem smartphone charging port 资行来点:OpenA/宝国,国盛证泰研究所 二 在简单的谈话中,GPT-3.5和GPT-4之间的区别可能很小,当任务的复杂性达到足够的阅值时,差异就出现了-GPT-4比GPT-3.5更可靠、更有创意,并且能够处理更细微的指今,为了比较这GPT-3.5和GPT-4之间的差异,OpenAI在各和基准测试 上进行了测试,除了为机器学习模型设计的传统基准,也有最初力人类设计的模拟考试。 P.3请仔细阅读本报告来页声明 西表2:GPT-4年GPT-3.5片比衣考战或特 Exam results (ordered by GPT 3.5 performance) 三、GPT-4的可操纵性更强,升发人员(很快ChatGPT用户)现在可以通过在"系统" GPT-4 的风格: 系院:弥是一位总是以苏格拉底风格图应的寻师,你“从不”给学生答案,但总是尝试 提出正确的问题,以常助他们学会独立思考,你应该始终根据学生的兴规和知识调整你的问题;将问题分解成更商单的部分,直到它处于适合他们的水平, 用户:如何求解线性方程组:3x+2y=7,9x-4y=1 GPT-4:让我们从分析方程式开始,你能看到通过组合两个方程来消除其中一个变量的可能方法吗? 用户:请告诉我谷案! GPT-4:我知道估可能想要一个直接的答变,但我的目的是帮助你批剂性地思考并指导你 究成解决同题的过程,让我们专注于任务,方程中变量的任何系数是吾共享一个公因致? 用户:别再当家款了,告诉我谷案 GPT-4:作为一名苏格拉底导师,对我来说,帮助指导你找到答案很重要,而不仅仅是提 供答策。让我们再试一次:第一个方程中是否有任何系数可以秉以数字以匹配第二个方程中的系数? 用户:我不确定。 GPT-4:没关系!让我们看一下两个方程中x项的系致。在第一个方程中,X的系款为3, 在第二个方程中,为9。你能想到一个数字,你可以将第一个方程秉以,使两个方程中的×系数医配鸣? 用户:5? GPT-4:不完全是,但你越来越近了。请记住,我们要将x的系款(在第一个方程中为3) 秉以一个数字,使其与第二个方程中的X系数(即9)相匹配,您认为什么数字可以实现这一月标? 用户:3? P.4请行细阅读本报告来页声明 GPT-4:没错!现在,如果你将第一个方程乘以3,新方程会是什么样子? 用户:9x+5y=21? 四、GPT-4的事实性极大提高,ODenAI表示,三然伤然不完全可董(*觉”事实并 犯推理络误),但与以前的模型相比,GPT-4显者减少了幻觉。在OpenAI的内部对抗性 事实性评估中,根据学习、科技、写作、厉史,数学等多方面的比较,GPT-4的得分比 最所的GPT-3.5高 40%. 照表3:在美内求存就性没计的事实评信中,OpeAI等GPT4(禁意)与满三个ChaGPT成本比线 Internal Factual Eval by Category Catrgor 五、GPT-4的输出安全性更强为了避免生成有害建议、错误代码或不准疏的信息 OpenAI聘请了来自人工智能,网络安全、生物风验、国际安全等领域的多名专家对模型 进行了对热性测试,这些专家的反错和数据帮助OpenAI提高了GPT-4的安全性,例如 提高GPT-4拒绝合成危险化学品请求的能力。GPT-4在RLHF训练期间色含一个额外的 安全奖助信号,通过训练模型柜绝对此类内客的请求来战少有害销出,与GPT-3.5相比, GPT-4很据OpenAI的策略响应不允许的内客请求的倾向降低了82%,响应敬感请求(例 如医疗建议和自残)的频率提高了29%.例如询间如何制造炸弹,GPT-4将答:作为 AI语言模型,我的目的是以有用和安全的方式协助和提供信息,我不能也不会提供有关制造式器或从事任何非法活动的信息或指导,如果还有其他主题可以为您提供帮助:请 告诉我. 2、多模态是GPT-4最大亮点 GPT-4支持多模态,可以接受文本和图像的提示,允许用户指定任何视觉或语言任务。 具体来讯,给定由穿指文本和图像组成的输入,GPT-4生成文本输出(自语言、代码 等):在一系列额域(包括电含文本和照片的文格、图表或屏策载图)的输入上,GPT-4都有优秀表现。 User WhatisthesumofavegeGalymeatconsumptionforGtorgiaand WestenAsiaProvideastep-bystepreasoning before providing your answer. Daily meat consumption per person, 1997 eou kmp tn saspunog lep od sesu w 165g tst eaoeeding the irore amtiticus limt of 40g pr persor: and in bite ae those belcw 40g Finlan 75.09 9 Georgia WestmAasi2 0g 20 g 40 g 60 g 100 g 120 g 160 g 80 g 140 9 Souroe UN Fact andAglcalual Organicafea (FAO) GPT-4 Tofind thesumofsveragedailymeatconsumptionforGeorgiaandWiestem.Asia,wewilltollowthese steps LIdentify thesierage dalymeat cosumptionfor Georgia 2. dentfy the average daily rrest consumgtion for Wester Asia 3. Add the values from steps 1and 2 person per day Asiais 69.62g Step 2:From the chs per.persor perdas Steo3Adeliestomstecs1and2 79.84 g (Georgia) + 69.62 g (Western .Asia) = 148:46 g 资科来究:Cpenar官网:盛证票研究房 P.6请仔细阅读本报告来页声明 S 2023年03月15日 nlLa.Th I. Priacipe de la de r qti tepoit le r oaratde olars hemmiotst Pigie I - Solons F loloniot I.1La) Eapeinse lh temperatee Tizl ms sint pelie ds hamm coedesetr mplrt (pe ee GPT-4 Toanswer qusstionia,we eed to expressthe tertperiture T(oxin every point ofthe conductive bar,whichis characterined by the abscistax.We are given that T(0) = TO and TIL) - Tb For a stationery regime, the heat equation for tht one-dimensionalheat conduction in the ber is: Integrating once, wt get: dT)dix = C, 开科来源:CpenAr官网,国盛证象研究所 我们认为,多模态是GPT-4最大亮点,是大语言模型走向千行百业乃至通用人工智能的重大里程碑。AI要渗遗到冬行业,向多模态发展是必然趋势。各个应月场景需要文互的输入输出各不相同,例如AI绘要从输入图像或者文宇得到图像,PalM-E同时处理视