周鸿祎:目前对于GPT有很多不同的观点,这是正常的,我今天也不是来谈技术,而是从产品角度阐释我的理解。 1.GPT为什么能成功?首先是OpenAI的长期主义选择了正确的技术路径(暴力美学),别的公司都点错了科技树,没有人想过通过大力出奇迹的方式能够将人类所有的知识给大模型训练。Web3的创业者曾经将我当作古典创业者批判,但我认为用户不管你是否去中心化,只关心解决了什么痛点。当互联网初代第一次用邮箱、用OICQ&QQ、用搜索的时候感觉到了前无所有的便捷,这样的产品才是有生命力的,元宇宙和Web3的问题就在于他们的概念很大但是他们只存在云圈子里面,普通人并不会关心概念,你并不会因为去中心化就去某个饭馆吃饭。 ChatGPT之前我们大众和人工智能的距离依然是相对较远的,ChatGPT之后从员工到老板、从文案到美工都找到了效率提升的方式,就像互联网和个人电脑风潮来临时并没有受到关注,但用户层面上对于他们的偏好使得他们成为了改变历史的产品。 微软和OpenAI这种产研关系也是ChatGPT能够成功的核心原因。国内未来纷纷闯入大模型,做一个大模型的原型是容易的,但是我们要做到GPT4/5是有代差的。这里面其实可以学习他们的产研关系,特别是现在人手一个Meta开源的大模型的情况,最关键的不是大模型的技术、人才,而是如何借鉴他们的产研关系、工程化能力、用户场景才是核心。 2.我的第一个观点是:GPT已经拥有了真正的智能。很多人认为GPT虽然能够完成任务,但是只是从概率学角度的一个填空机器,并不具备真正的智能。微软对GPT做了非常多的COT测试,需要多轮思考过程的问题GPT都能够回答。凡是人类不能讨论的事情就无法理解,人类如何定义理解?语言和文学就是理解的边界,虽然机器是硅基的,但他能够通过大模型去理解我们的语言的时候为什么不承认他们的智能?人类试图研究鸟类飞行的方式发明出来了飞机,我们也不能说飞机因为不是按照鸟类飞行的方式飞行就不是飞行 3.过去的AI只能通过训练解决一个垂直场景的问题,他们无法解决通用的问题和场景,而GPT就说通用场景下的最强人工智能。GPT4和3.5看起来没有区别,但是GPT4在理解能力上已经完全超越了上一代,所以它通过了无数的专业考试。很多人质疑GPT的缺点,但沉浸在过去的人对现在的产品永远只能看到缺点,GPT的进步不是和人类一样线性发展的。在过去平稳发展五十余年到了今天它的智能会出现指数级的进化。它的大脑伪装在亲民的界面中,但它不是玩具,它代表着人工智能新时代的来源。尽管理论上看它是一个概率机,但是从量变产生质变,从混沌产生突现,这可能是第一次我们观察到人类大脑是如何产生智能的。此外我认为我们从小孩学习的过程中也能发现它和GPT学习的过程中是非常类似的。 4.GPT到目前为止有四个不可解释的现象。 1. 涌现:过去的垂类模型因为参数太小,多次训练并没有诞生强大的推理能力,而大家发现在千亿量级参数的模型中出现了推理能力的显著提升。如果我们相信进化论,人从猿进化而来一定是某个节点的神经元达到了某个量级,这与GPT是类似的。 2. 幻觉(hallucination):很多人觉得它是缺点,但是为什么大模型会出现幻觉?这恰恰是它的能力展现。只有人类拥有幻想、语言不存在的事情的能力,我们才拥有了宗教、社区。创造力本质上就说把不相干的东西结合在一起,为人类带来了无穷无尽的创新,未来的某些大模型在创造行业恰恰非常需要这类能力。此外人类也是会做梦的,幻觉和做梦就非常类似。 3. 能力迁移:95%的大模型训练参数来自拉丁文,但它在其他语言上的回答能力也非常强。我认为在不同语言后面可能会存在某种通用的逻辑,但目前没有被我们发现,而大模型在学习海量资料后掌握了这种能力,这是它在不同语言下依旧有很强的能力的解释。 4. 逻辑增强:发现通过学习Github后GPT的自然语言条理性得到了增强,这也是为什么我们的孩子需要学习去增强自己的大脑。 5.GPT是一场新的工业革命。它不仅是一个搜索引擎、办公工具,它会把我们的所有产业都重塑。过去大数据离我们个人很远,也仅掌握在不发头部企业中。LLM首先对数据没有要求,只需要简单清洗标注,训练出来的模型可以在各行各业中使用,是类似电一样传输到每个企业中。过去的软件还在低纬度竞争,以GPT为代表的产品会将竞争拉到完全不一样的水平,是单方面的降维打击。过去是互联网+和互联网思维,未来是AI+和AI思维。 6.中国能不能做自己的GPT?我的答案是肯定的。ChatGPT是组合式创新的结果,开源的技术、软件、算法会像核武器扩散一样,行业的其他颠覆者会持续搅局。我们国内的企业在从0-1可能有点困难,但是从1-10依然是有优势的。我们国内的企业在场景化上是有自己的优势,我也一直强调国内企业产品化上拥有非常多的经验。此外我们拥有最好的互联网人口红利,用户的使用反馈会让GPT持续进化。未来可能会有人工智能训练师的大量需求,解决我们现有的劳动市场问题。 但我也需要强调,我们需要正式和微软OpenAI的差距,目前大家的得分基本上都是及格,和GPT4的差距基本在2年以上,和GPT3的差距在3个月左右。而且我们研究的路上GPT5可能发布了,国内的创业公司和互联网巨头都会在GPT上有机会。我们的GPT需要用户的支持、理解和宽容,在推理能力、思维链的差距依旧需要使用来提升。我们既不乐观追求速胜,也不悲观完全放弃。 GPT带来的挑战:任何数字化都会给安全带来挑战,但不发展是最大的不安全安全方面 1. GPT本身就有安全隐患, 2. GPT的规则是难以解释的,通过独特的提示词避开合规系统使他做违法的事情。3. GPT会不可避免的带来资料泄露的问题4. GPT对漏洞攻击非常删除,甚至可以直接编写恶意代码 劳动力方面,未来只会属于善用GPT的人,如何将GPT打造成自己的工具,如何通过自身的创造力和批判精神使用GPT才是关键。人工智能的问题也是能源问题,总有一天我们会遇到能源的限制。 我预测GPT一定会产生意识,在GPT-8左右就会产生意识。我觉得马斯克喊停是别有用心,但一定是有人看见了GPT出现了人类不能解释的能力。但目前我们和美国的差距存在,必须要坚定的发展,不发展才是最大的不安全。 预测一:它的进化速度会非常快。GPT3.5的时候还只能通过文字输入,等4的时候就已经拥有了理解能力。我们人类世界大量的、视频会成为它进步的俩元 预测二:侠义的手和脚是机器人,广义的手和脚则是通过GPT操控的机械。而他推出的插件系统使得它已经不只是机器人了,通过和网站的结合可以通过API完成控制世界的能力。 如果畅想一下GPT可以通过自己修改自己代码使得自己的模型能力升级,包括国内有很多大模型企业就在用GPT的素材训练是的它快速解决GPT的能力。 预测三:数字永生成为可能。 360大模型:我们的思路非常简单,两翼齐飞+三路并发。 两翼齐飞:我们自己组建了了GPT团队,通过过去搜索的经验,我们能逐渐赶上GPT。 此外我们还注重三大应用场景:1.toB/toG私有化大模型,必须要把公域的知识和能力加入;2.对于中小企业来说就是生产力工具相关的应用,我们会和企业合作;3、toC方面我们有搜索引擎、浏览器,能和用户的工作结合。欢迎大家加入360做中国人自己的大模型。