您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[天风证券]:天风:ChatGPT展望和AI解读20230326 - 发现报告
当前位置:首页/会议纪要/报告详情/

天风:ChatGPT展望和AI解读20230326

2023-03-25天风证券改***
天风:ChatGPT展望和AI解读20230326

【主持人】:各位投资者,下午好。我是天风负责传媒和海外的分析师孔蓉。今天下午非常荣幸我们邀请到了前段时间可能在互联网上传播的比较广泛的一篇关于ChatGPT的五个最重要的问题的作者,我们的孙总,跟大家做一个分享 。因为我们也看到这段时间整个AI发展的速度,不管是GPT4的出来,还是昨天可能也可以通过插件去接很多直接的应用,其实也开启了一个新的AI的时代。在这个过程中,我们在ChatGPT里面哪些是主要的几个问题。今天有请孙总跟各位做分享。在孙总分享完以后我们有一个简单的交流,再是通信、电子以及计算机的各位分析师也会跟大家再做一个汇报。 接下来先把时间交给孙总。 【孙总】:谢谢大家,不方便透露公司名字,我是一个在美国读书工作,后来来到了国内的大厂工作。我自己是一名数据科学家,在这之前也跟AI和数据、建模这些东西都是打了蛮多交道的。所以我在过去读书和工作过程中对过往AI的限制有比较多的理解。ChatGPT出来之后对我是非常大的震撼,所以我就花了,正好我的工作也有一些研究性质,我工作时间和课后花了非常多时间研究这里。正好之前自己的工作也让我认识硅谷比较一线的专家或者说是工作者,跟他们有很多交流。我在交流过程中也发现大家对这个东西有一些非常错误的认知,这些错误的认知我看了就受不了,写了关于ChatGPT最重要的五个问题 。 我觉得我们先要对它的本质有一个共识,或者起码我们把为共识,大家肯定有的人觉得这个东西特别有创新,有的人觉得不过是一个聊天机器人等等。我们要把这个非共识搞清楚,细化到几个关键因素上,这样子我们才能对我们自己形成判断,是这篇文章的由来。 我自己有一个自媒体在B站上有,叫课代表立正,有一些简单的分享会放在那上面,大家也可以去看一下。 我直接介绍一下我的文章。这个文章一开始有一个对于大模型的科普,大模型ChatGPT到底是什么?如果说大家打开看这个,我觉得开头里面有一个图是比较重要的,重要的关系图可以讲一下。开头那章有一章是一个重要的关系图,那里面说了GPT4、in-contextlearning和ChatGPT是什么关系?我这就不说太多技术细节了。我告诉大家GPT4或者ChatGPT和过去的模型有两个非常重要的不同。 第一,过去的模型是专模型专用,你出来一个新任务,出来一些新数据你要新训练一些模型,这个模型本身是必须要修改才能做新的任务。如果说有一些同样的任务,但是新的数据,模型也要修改内部的残局才能在新的数据上表现的比较好。 但是ChatGPT这样的大模型是把一个底层的大模型训练好了以后,这个大模型就不动了,你可以拿着这个大模型数据加工,但是这个大模型本身是不动的。这是为什么看到OpenAI还有GPT3、3.5、4,他说GPT4一出来是划时代的东西,因为这个大模型本身的能力决定了这个大模型之下你的各种应用方式的能力,所以大家可以想象这个大模型GPT3、3.5、4,有点操作系统的感觉,它是windows95还是windows98,你95上跑的东西和98上跑的东西不太一样了,所以大模型是很重要的,它是不动的。 我们有in-contextlearning,如果大家对技术细节感兴趣,我会讲得非常详细 。但是不管怎么样你有了in-contextlearning你就可以不需要改变大模型,把它加工成其他的方式。其中出了一个论文,InstructGPT把这个模型和人类的要求对齐的比较好。ChatGPT在这个基础上把大模型和人类对话的方式对齐的比较好。当人类对话,人类可以跟大模型对话的时候,人类就发现这个大模型太牛逼了,它怎么可以做这么多事情。然后就解锁了各种各样的使用方式,包括我们看到…包括最近出来的各种各样的软件,其实都是在ChatGPT大的范畴之下,ChatGPT是GPT4的方式,基本上我们是围绕着ChatGPT这些去展开了无限的可能性。我一会儿会展开说它为什么这么厉害。总之这就是这个模型的关系。 所以说我们要知道一个要点,大模型的能力,就是GPT4的能力才是我们要关注的东西。我一会儿也会讲它的壁垒是什么?和国产和它的区别。我们接下来会看到无数个模型都能做到看似ChatGPT对话的形式,其实我们之前在国内已经看到几个了,不光是最近的,ChatGPT刚出来的时候其实我们就看到了很多。拿着一个不需要很强的大模型就能强调出来这个对话,它这个对话看起来还像模像样,但是背后大模型的功率差得是很远的。 我刚刚说有两个点,第二个点我可能在第一个里面更详细的展开。第二个点就是过去是鹦鹉模式,ChatGPT是乌鸦模式。它有了一个和以前完全不一样的能力,对于我来说感觉它好像狗突然会说话的感觉,非常震撼。 如果回到一开始,我会提哪五个问题,和为什么这个问题很重要?或者不搞清楚这五个问题大家就没有办法形成自己的判断力。 其中第一个问题是最重要的,ChatGPT是什么? 它是一个范式突破还是和过往AI的延伸?ChatGPT和过去AI的区别到底是人类和猴子的区别还是一个好一点的模型和差一点的模型的区别?就比如说我们过去的AI,有的说是图像识别,图像识别有准的和不准的,ChatGPT可能说大语言模型,大语言的能力有好有坏,它到底是一个线性突破还是范式突破?它是一个聪明一点的猴子还是就是人?大概是这么一个问题。这个问题就会让我们知道ChatGPT本身的机会有多大,到底是Iphone那么大的机会呢?还是一个可能图像识别算法那么大的机会,或者是alphaGo那样的机会。 我自己的观点是它是一个范式突破,它是人和猴子的区别,而不是聪明的猴子和不聪明的猴子的区别,我的个人观点,我也会在文章里面和我一会儿讲的时候把我为什么会形成这个观点给大家讲一讲,可是我在文章里面也列出来了另外一个关系,他们的证据是什么?和他们都是谁在支持这些东西,大家可以去看。 第二个问题,ChatGPT会达到什么样的水准? 更重要的是要理解背后假设ChatGPT是范式突破,按照我的论文思路说出去,如果ChatGPT是范式突破,它到底是个什么东西?正确理解这个范式突破也对大家要能抓住这个机会非常非常重要。比如说iphone在刚刚出来的时候很多人说这不就是一个屏幕更大的手机吗?iphone和之前的手机的区别就是一个全屏幕。我也做一个全屏幕我就可以做出来一个iphone了。后来事实证明这个想法是错的。iphone和像iphone一样交互的安卓已经完全统一了手机,在这上面 已经出现了十倍于过去互联网的机会。所以当iphone出来的时候你如果只是觉得iphone是一个大屏幕的手机,你就完全读不懂,也不可能抓住后面的机会。现在ChatGPT到底是什么?它的本质是一个什么东西就是一个很重要的问题。所以说前两个问题是最重要的,第三第四相对重要,但是没有那么重要了。也重要,但是相对没有第一第二个那么重要。 第三个就是ChatGPT的壁垒到底是多大? 因为我们知道过去我们中国在做开源模型,更多AI上并不是太落后,我们的研究数很多、专利数很多,关键是我们的图像识别算法或者算法没有落后国外,但是ChatGPT似乎和原来不一样了,它可能是一个我们可能会落后国外的东西 ,如果我说一个事实的话,我们就是落后的,而且这个落后还非常难改,甚至可能不比我们在芯片上的落后要少,它是一个非常非常难追的东西,大家要抱着两三年追不上ChatGPT现在水平的,不是说两三年之内能不能追上ChatGPT ,那个ChatGPT已经进化到不知道什么样子了,但是两三年之后我们的国产大模型能不能达到ChatGPT今天的水平?我觉得都是一个未知数。我也会跟大家讲一下为什么我会做这个判断。 这里面技术的迸发,本身就是一个你不是完全可以预测的,但是我也会告诉大家你应该观察什么东西来修正自己的判断。我的默认判断是国产替代两三年之内做不好,但是我会观测几个关键点,如果这几个关键点改了我的判断也会改 。 第四,我们作为非OpenAI的人,我们都不是OpenAI,我们都不了解另外一个大模型的情况下我们怎么参与ChatGPT,如何参与到ChatGPT带来的机会中。 第五,人和ChatGPT的本质区别是什么? 我觉得越搞清楚这一点越有助于帮助我们在接下来建立我们自己的核心竞争优势,不然你的工作就会越来越多的被ChatGPT取代。OpenAI之前也发了一个论文,绝大多数的职业都会暴露在ChatGPT的替代风险之下,尤其是ChatGPT进化过程中很快就会比一个,可能在工作了好几年的大学生、聪明的大学生效果更好的情况下。这个可能也对现在正有孩子的话,对你孩子的教育比较重要 ,你应该让你的孩子去学什么。我是觉得大家的孩子都不要去学补习班了,补习班就是太浪费时间了。 我这个介绍花了15分钟,我觉得可能每一章简短的用五分钟讲一讲也是要25分钟,我们再看看大家对哪些更感兴趣再重点介绍。 第一,ChatGPT的是范式突破吗?它是一个聪明的猴子还是人和猴子的区别? 要知道这个我们就要知道,过去的机器学习它的限制是什么。过去的机器学习是找到数据中的对应关系。其实就是一个鹦鹉学舌的游戏。不管之前的alphaGo也好还是各种各样的人工智能助手,其实都离不开这件事。 我这举一个具体的例子,大家如果到时候在饭桌上去跟别人说,其实懂的人一下就会懂了。人工智能有一个图灵测试,你让一个人跟机器聊天,这个人到底能不能知道这个机器是个机器还是个人?如果不知道这个人是个机器人,那就通过了图灵测试。但是这个图灵测试是不完备的,所以还有另外一个测试。 举一个简单的例子,我跟一个人去说话,说我朋友推荐四川火锅而不是日料,因为它不辣。这个它代词指代的是日料?我们都知道是日料,因为它辣。这个时候我朋友推荐的是四川火锅而不是日料,因为它不辣。这里边的它指代的日料,因为它不辣。 第二个就是我的朋友推荐四川火锅,而不是日料,因为它辣。这个时候我朋友推荐的是四川火锅,它指的是四川火锅,因为它辣。 这两个句式大家看到结构是一模一样的,但是它的代词指代是不一样的。这个代词是根据上下文来确定的。我们作为人知道火锅是辣的,但是日料不是辣的 ,我们知道这个代词指代的是什么,但是作为机器来说不可能知道这件事情,所以机器是无法测试出来这个东西的。 可是ChatGPT就能干到这件事,你如果跟ChatGPT4去问一下,这里面它指代的是谁,ChatGPT是能够给你答案的。所以ChatGPT是能克服这个测试,但是过去所有的模式而言,不管它做的多牛逼都克服不了这个,除非你把答案喂给它,这就是鹦鹉学舌。鹦鹉学舌是不可能知道这件事的,要理解上下文才知道 。 我们回到ChatGPT,它就是一个乌鸦的能力,这是在朱教授2017年的时候的文章里面讲的,朱教授是我们华人研究AI最厉害的学者,他专门讲了智能的本质 ,一个非常长的长文,讲了乌鸦这件事。他建议大家都把乌鸦做成图腾,乌鸦能干什么呢?乌鸦在城市里面想打开坚果,它会发现坚果我自己打不开,但是车能把它压开,但是车又对它有危险。它又发现红绿灯能控制车的,红灯停绿灯行。所以它能干的事情是把这三件事串联到一起,它把坚果故意扔在红绿灯前面的车前面,让车把坚果压碎,它在红灯的时候把坚果安全地吃掉。所以这个是它有理解能力的证据。这里面是复杂的能力,包括推演、演绎、执行等等 ,所以说在我自己的文章里面就会把ChatGPT和过去的区别去总结成乌鸦和鹦鹉的区别,我会说ChatGPT有乌鸦能力。但是如果想简单一点说ChatGPT是有理解能力的,很明显ChatGPT是能理解我们说话的。朱教授在2023年年初他自己说ChatGPT不是乌鸦,它是一个大型鹦鹉,他说这个是因为ChatGPT的原理我们都知道。但是这我就和他不太同意了,朱教授,包括facebook的首席科学家,他们都觉得ChatGPT的原理我们都知道了,它的技术不是一个新的技术所以说我们也知道不是新的技术也不可能带来新的突破,这是他们的想法。所以我们知道这是这样一个模型,只有可能是巨型鹦鹉而不可能是乌鸦,它只有可能是更聪明的猴子不可能是人。可是这我就点出来