您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[民生证券]:神思电子:首席科学家闵万里博士在民生AI峰会上的讲话20230426 - 发现报告
当前位置:首页/会议纪要/报告详情/

神思电子:首席科学家闵万里博士在民生AI峰会上的讲话20230426

2023-04-25民生证券意***
神思电子:首席科学家闵万里博士在民生AI峰会上的讲话20230426

演讲主题:人工智能的产业外延与认知内涵演讲嘉宾:闵万里博士神思电子首席科学家 当你写一封情书对一个又胖又丑的人去写的时候,你硬要去凑是不行的。同样的,当你写宝马和冰激凌的时候要从心灵上打动他,打开宝马的那一刻就如夏天打开了一个冰激凌贴心。文字的剪辑并不代表感情的共鸣,尽管大语言模型或者大模型今天给了我们耳目一新的感受,但是我们把它放在一个更大的历史颗粒度上去看,其实有更底层的规律需要我们去发掘,这个规律如果我们把握了,我们有可能在另外一条技术路线上找到另外一个横切所有行业的技术路线 。离开阿里之后我带着团队自己做的,两个完全不同的行业,但是用的底层模型是一模一样的,而且都回归到了人类的神经网络、人脑的神经网络上。 我想从这张图开始,当苹果打在你的头上的时候,不同的人看到的是不同的商机,有人会说这个苹果熟了,我赶快组织物流车队赚它一笔,有人会打开这个苹果发现口味特好,开始囤积制造市场上的奇货可居,只有牛顿看到了万有引力。历史上这样的事很多,科技的发展每一个现象的出现有人去解读了表象,有人是看到了人类认知之外的事情。今天我们当然炒股票可以搞一波行情,没有问题的,总会有人在你后面接盘,但是如果我们要做人类社会的推动者,我们需要的是判断底层逻辑,无论是从数据的传承和计算力同比的增加,几千年的历史都是这么来干的。 在这个过程当中,我们对世界的认知、对生产力的改进,我们认知世界再改造世界不断是螺旋式的上升,从模糊的观念到精准的推理,再到模糊的观念再到精准的推理,认知的世界在拓展,科技拓展认知的边界,技术丰富我们改造世界的工具。如果我们对科学没有抓住本质的东西,我们永远跟随的是别人的大模型,大模型不是唯一的解法。 不管投谁都希望知道下面的公式是成立的,产业链和科技链的结合能够创造增值,如果这个公式不成立,你的投资就是一个搏杀。我们需要清醒的看到下面的公式是否存在,什么样的科技在什么样的产业链上能够创造什么样的增值?这个价值是正向的,还是负面的,还是昙花一现的?科技的本质和产业发展趋势之间是否能够相向而行,还是背离初心? 我们讲在短短的20多年当中,人工智能这个小小的领域有几个里程碑的事件,很遗憾没有一个和我们相关。从1997年DeepBlue打败了Kasparov,Watson再到AlphaGo,再到ChatGPT,这几个过程我们如果把它回过来看一下它们有惊人相似的地方是底层的相似,绝对不是模型的参数从1个亿到10个亿到1000个亿…。 我们先看一下先进的生产力转化为生产力工具别人是怎么干的,深蓝最后变成了BlueGene,然后再到WatsonHealth…DeepMind医疗的电子病历再加上一些(英)要去做Health。再到AlphaGo,开始挑战人类的认知边界,去试图解析蛋白质的结构,如果有一天因为它的突破能够让帕金森症、老年痴呆症、失眠症等等迎刃而解的话,今天OpenAI做了ChatGPT,它开始做到了ToC和ToB ,花钱交月费给它训练数据,在教它变得更好,人类反馈的强化学习的机制让它非线性的增长,在这个道路上再想去追赶它是不可能的,除非你还有个非线性增长的模式。 这四个阶段,TOG/ToB再到ToC/ToB,吃一堑长一智,当它进入到这种模式的时候,我们会发现说原来大数据的力量结合好的产品直接面向全世界上亿个消费者的时候都变成上亿个教练,上亿个教练从3到4能力涨了很多,没法追赶。 把它的趋势我们看一看,其实就是一件事,当先进的生产力率先转化为生产工具的时候会成为一个平台,最终呈现的是一个生态,这点我就不赘述了。同样的事20年前发生了,当(英)两年之后,2005年推出了云计算,它支撑了亚马逊一半以上的市值,以计算这个服务(英)作为一个核心,构建了云计算的生态,所以它成为的一个科技公司,不是一个电商公司。类似从一个业务的底层去抽象一个科技的驱动力,把它转化为一个横切的生产力,一次又一次的发生 ,而不是我们等待着我们模仿别人,它有大模型,我也有大模型,我想下一次的爆发绝对不是大模型。 我们回顾一下历史它们都有惊人的相似之处,Watson提出的是DeepQA,在2011年打现场比赛的时候,后面有几十个人的团队在训练它,在反馈它,那个时候没有GPU,没有今天这么好的计算条件,但是即便是如此还是把它打败了 。作为我的老东家,我只能说它很好,曾经离真理那么的接近。 我们再来看一个,ChatGPT也是一样的,它第一次把神经学习和强化学习交叉起来了,我们的人在发育的过程当中也是不断地在强化自己的认知,从我们做错的题目当中找到哪个知识点要强化它,最后变得越来越强,最后变成一个高考状元,其实整个学习的过程就是强化的过程,它找到一条路让深度的神经网络能够快速的消化、吸收和理解反面的副样本,把副样本总结起来。Policy和Reward本质上也是类似的,他们在用同样的手法在两个不同的领域快速的迭代取得了成功,绝对不是神经层增加了多少层的神经网络,不是这样的,它是在一个非常复杂的规则确定的具备无限可能的放射性的束当中快速的锁定到最有可能的路径,快速收敛,然后再用一些算法的形式上它工程上能够迭代的更稳定。本质上它们是用了类似的思路,就是底层的原理上两个(英)之间的双边迭代。 我们再来看一看AlphaGo具体到最后做了一些什么事,它下围棋成功之后做的第一件事情就是人工智能去改变数据中心,我们今天讲大数据中心,数据中心的能耗怎么样优化、降温,这是一个非常难的世界级难题,可能在座的知道有PUE靠近1.0,现在基本上达不到的,1.1级已经是非常好的了,但是它用AlphaGo的方式去寻找几千个控制节点,使得整个温度场的分布更加均匀。再有它去挑战AlphaFold,这是人类健康史上颠覆性的事情,这些东西可能是底层的科技正在从根本上改变人类社会的事情,绝对不是写一个小说、写一个求爱信,求爱信这是情感价值是可以的,但是人类更需要的是拓展我们的认知,打败个体的智能是很容易的,打败人类的智能是很难的,这些公司做的是打败人类的 、拓展人类的边界。 同样的道理,我们再来看一件事,四五百年前或者是到文艺复兴之前,所有人都说地球是宇宙的中心,最后写了三个公式说是开普勒三定律,推翻了地心说 ,成立了日心说。到这个地方剧本很完美,在前人的基础上最后写出了三定律出来,但是只有一个人,牛顿提出了一个公式,万有引力的公式解释了所有的天体行为。掌握底层规律的人能够看到未来、定义未来。而数据挖掘的人会总结、会演绎、会博取掌声。今天同样的道理,如果我们去问ChatGPT,请问如何把半导体流片的量体率(音)提升上去,或者怎么样把失眠症的人让他能够 快速入眠,治疗怎么治,或者说有帕金森症的人,得了脑性中风的人应该怎么样介入,在哪个通道上用多大的刺激量刺激多久,这些专业的问题是需要去回答的。 检索、搜索、探索,检索,到图书馆去条目都很清楚,然后查什么科什么子类 。搜索没有科目分类,但是这个知识已经在互联网世界当中,你只要把它找到关联性。探索是从来没有过的,在人类认知的边界之内就没有的东西,我们要去探索。所以AlphaGo当年选择了探索,尽管这条路不是那么快,但是一旦它成功,我想它是通杀式的。敢于去选择探索的是一种莫大的勇气,也是莫大的自信,有技术自信,为什么?因为它掌握了底层的原理。 我要用这张图来讲三件事情,无论是DeepMind,还是Watson,还是ChatGPT,其实背后用到的神经网络,如果我们把它做一个同构的映射,它的科学抽象是什么?其实就回到人的本质,就是人脑。人脑大概是这样的神经网络结构,重要的是每时每刻每个神经元在放电,神经元和神经元之间的信息通路,信号通道是最重要的,很多时候信号通道不通畅,信号传不过去,就导致认知的障碍、记忆的障碍、睡眠的障碍等等,甚至到后面就是你控制不了脑区,就控制不了你身体的行动,都是因为信号通道出问题。 如果我们今天用暴力的方法去想想这个网络,800多亿个节点,每一个节点处在二分类的状态,激活或者不激活状态,或者稍微复杂一点是0-1之间的混合态,这样的一个网络大小以今天的计算量和计算能力是完全可以暴力求解的,现在都已经干到上万亿了,所以我们存在一种可能,用超大规模的计算量在这个数学结构上去做超大规模的神经网络控制和优化,反向调控它,这件事情正在发生,我想大家知道马斯克还有另外一家公司叫做(英),正在做这件事情 。咱们讲控制生物体,如果对它的脑区做精准的刺激,能够让它做什么事情,这样一个想象空间远远比一个文字要来得更加大,它的可能性更多。 这样一件事从几十年以来就一直在干,包括做神经网络的和最近在做深度学习的人也在做一个验证,说人脑的神经元相当于5-8层的网络,这是国际上Neuron杂志最新的报道。也就是说,如果一个大脑的神经元用5层的神经网络去描绘它,我最不济把上百亿个神经元都乘以5,1000个亿网络的量级,这样一个量级可以挑战它。我们的算力已经到了这样一个用暴力的方法去破解人脑秘密 ,或者说这么大规模神经网络的运转机制。 这个公司做的事都是类似的,这都是公开网站上的信息,除了他发火箭之外,还做这个事,大家要关注一下,这个的进展有可能真正让我们对人的健康等等很多底层疾病的机理和介入的机制和通路找到了下手的地方,它的价值不需要再证明了。 回过来讲,我们把今天人脑的东西无论是(英)迁移到很多个垂直的场景当中 ,其实我给大家看到的这张图是各行各业都有的,从城市的交通到管网到生产工艺流程,整个车间也是有工艺流程的,每个岗位相当于一个神经元,神经元和神经元之间传递的是人机料法环这些参数的流程。如果你从这个角度去映射 ,几乎所有的带有前后顺序的决策流程和生产流程、交通组织等等都是一个大的神经网络,一个城市有神经网络,一个工厂有神经网络,一个组织也有神经网络,甚至就一台小小的锅炉也有神经网络,它有N多个控制按钮控制环节,但凡有物理世界当中的先后顺序和固定结构的一种场景都可能映射到这样一个 拓扑结构。这个神经网络当然可能很复杂,有几十万到上亿个的节点,再加上参数量一下就很容易爆炸,所以用纯暴力的方法当然是很复杂的。 但是好在把这个问题抽解为一些数学问题的话就变得简单了,一个复杂的网络找到最小的局部结构,在这个结构上下手解题,就是刚才讲的很多做认知科学的人是用实验的方法去找通路,但是今天用机器学习、用人工智能的方法、用海量的数据可以算出这个通路,这个算的方法不是我发明的,300多年从Bemoulli大数定理,每一个节点源源不断地看到信号,看到这个时间信号之后,假定你一直在看这些信号,最后你会得到什么?再往后一系列的科学家,因为网络的复杂性和时间关联性趋向的是(英)。 这些伟大的科学家都在解一件事情,在一个神经网络的节点上不断地观测到海量的数据,然后考虑到节点之间的关联性和时间关联性、空间关联性,怎么样来描绘它的理论上的大样本性质?然后再反推这个网络的结构,这些伟大的科学家做的事情今天我们稍微把它移植过来一点点数学公式,可能四两拨千斤,很多问题就迎刃而解了。 我自己做了两个案例,这两个截然不同的方向,但是用的就是一个模型,而且是我自己写的,这个文章是我发表的,这件事情而简单,这个地图上的放大镜里面有两个东西,救护车要左转,信号灯是左转的红灯,前面的车挡着它,没有听到救护车的声音,如果把一个城市想象为一个智慧体,这个神经节点出问题了,我们有那么多的摄像头在天上,能够把交通违法抓的特别及时,罚款罚的也特别及时,但是我们就是看不到这个救护车需要左转,或者说提前能够把车清空,让它能够不用闯红灯的过去,这件事情不合理,但是大家能够理解,但是习以为常了。让这个城市的每个道路节点神经元变得聪明,让它能够提前感知到几点几分几秒到达这个路口,提前多少秒把这个灯变绿,把前面的车清掉,让救护车到医院的时间压缩一半,这个就是生和死的考验,价值不用多说 。 给大家报告的是2017、2018年的时候,我们在世界上首次做成了唯一的一个任何时候、任何地点出发,用救护车把病人送到医院全程一个红灯没有,全程绿灯,神经元上看到的是