演讲主题:AI浪潮下的数据供给与数据安全演讲嘉宾:魏强浩瀚深度CEO 各位嘉宾,各位朋友,大家下午好。从去年以来人工智能、ChatGPT以及数字要素着实在整个二级市场和国内的市场非常的火热,对于浩瀚深度来讲这个热潮既是意料之中,又是惊喜。 浩瀚深度是将近30年的公司,我们在2013年公司更名的时候,我们把公司曾经申请更名为浩瀚数据,但是这个名字在工商注册的时候没有申请下来,我们英文名字从那个时候起就坚持叫浩瀚DATA。浩瀚公司实际上在十几年前一直就在瞄准着大数据的采集、挖掘,以及应用等等相关行业的应用,今天我给大家汇报的题目叫做AI浪潮下的数据供给与数据安全。 首先给大家简单介绍一下浩瀚公司的背景,公司成立于1994年,我们也在2022年8月18号在上海证交所科创板上市,作为一个互联网流量和数据智能化的领航者来讲,浩瀚深度一直在相关的新业务、新业态、新模式下面进行探索。 从目前来讲,我们主要给国内基础的运营商:电信、移动、联通提供一体化的解决方案,从设备部署的位置来讲包括了主要的这些国家互联网关口出口和重要的链路带宽出口,包括骨干网出口、IDC出口、省网出口、城域网出口,以及移动核心网出口的位置,同时基于前端的采集控制DPI的设备,我们也提供一整套的网络智能化的解决方案和信息安全防护的解决方案。 从整个部署来讲,目前我们公司的产品和系统已经部署在全国31个省市三大主要运营商,对于国际出口和互联互通的出口,以及主要这些链路覆盖的带宽,到今年设备覆盖的链路带宽已经达到了800TBPS这么一个带宽的速度,而且每年大概以300T-500T的规模在进行增长。本身来讲这个流量就会产生巨量的数据,目前我们在运营商侧每天产生的数据量达到了PB级,这是一个非常大的规模。 浩瀚深度最近20年的发展基本上是赶上了整个IT和信息行业技术的浪潮,包括了从2003年、2005年开始的宽带中国的建设,以及2008年3G进入移动互联网 ,我们最开始是基于主流的互联网TCP/IP技术,它本身没有非常完善的流量控制,以及业务和用户精准的识别能力。浩瀚深度公司大概在20年前左右就抓住这个机会研制了相应的互联网可视化流量监控和控制的设备,是以串接的方式部署在链路当中,这样子给我们运营商提供正常的网络可视化和网络运维,以及在后续智能化时代不断发掘数据要素的价值和应用场景。 经过在IT行业产业出现颠覆性转折的当前来讲,数据成为五大生产要素之一,算力需求高速增长的今天,浩瀚深度和客户将会建立起更为深远和紧密的协同关系。业界大家都知道在AI当前的浪潮下面,数据和算力都是非常主要的基础设施,运营商其实是有得天独厚的优势,浩瀚深度公司长期陪伴国内的基础运营商,一路这么走过来,我们其实在这方面未来会有很多的工作、很多的方向可以去突破。 我们目前要持续的推进DPI技术的产业化实践和广泛应用持续的推进,同时密切跟进网络安全和数据安全的新方向。我们可以不用谦虚的讲,芯片的设计能力在国际上都是一流的。我今天代表浩瀚深度公司也可以比较骄傲、比较自豪 的宣称,在网络可视化DPI这个行业来讲,浩瀚深度这样的公司国内国产厂家的水平也是一流的,国产替代这个事情我们大概在十几年前就已经完成了,当初在2007年左右的时候基本上都是国外的厂家,美国的厂家、以色列的厂家出售相应的设备给我们的客户,而且价格是非常高的。但是像华为、浩瀚深度公司投入到这个产业链里面去,经过自己的研发和掌握,国内DPI市场基本上是国产化厂家的份额,国外的厂家完全退出了中国的市场。 这是浩瀚深度拳头的设备产品,我们部署的方案是串接到链路当中去,DPI监控设备的性能和处理能力必须要和网络当中主流的路由器处在一样的层次,我们公司在大概2005年左右研制这款设备的时候就是一个硬件级电信级、高可靠性、高性能的设备,我们的设备是以FPGA芯片为核心,伴随着链路的接口和带宽数据的增长持续提升直接接入处理的能力,最开始的时候第一款设备只能提供千兆的处理能力,随着链路速率不断地更新换代升级从千兆到2.5G到10G 、40Gpos(音)到100GE,到我们今年会推出400GE串接接口的设备,整体我们是密切跟踪整个通信网络技术的演进。在2021年底的时候,工信部通信科学技术专家委员会也对我们公司整体的产品基于高性能DPI的互联网智能采集管控系统进行了评审,并得出了结论,浩瀚公司相关的产品和技术能力是处于国内领先和国际先进。我们公司在去年整个科创板上市的审核当中,对于我们公司科创属性来讲,问的是最少的。 在链路当中的数据是以串接的形式去做的,除了进行流量相应的监测和相应数据的采集,可以提供非常强的安全管控的能力。我是一个串接的设备,相当于链路当中的这些通信的流量都会进入我的设备,我可以根据相应的策略进行时延、降速、带宽控制等等,尤其是在出现一些安全事件的时候,比如某种病毒突然爆发,在网络当中产生大量的攻击流量,导致后端的应用服务器,或者说后台的平台操作服务能力出现了宕机,或者出现了不能服务,我们这个系统设备可以及时把相关的流量特征通过策略的形式加载到部署到链路当中监控的设备,就可以很方便快速的把相关的流量给筛除过滤掉,类似的功能就成为大网安全重要的底座。 我们今天要给大家汇报的一个主题一个是数据要素,一个是数据安全,花一点时间跟大家讲一下浩瀚深度在过去十几年时间我们目前已经做了哪些事情,我们现在在中国的骨干互联网上面大量设备的部署能力的建设实际上为AI浪潮下面的数据要素和数据安全这方面的工作奠定了非常好的基础。 对于公司来讲,我们未来其实是要掘金数据的价值,前面主要是以服务直接的客户运营商客户,为他提供一些网络正常的运维,让网络流量处在正常的状态 ,采集一些自身的业务需求,我们公司前15年时间挣的都是辛苦钱,都是扎扎实实通过把我们的产品、系统用好,让用户信任我们,相信我们。最开始我们在推出设备的时候,跟我们的客户讲需要串接在你链路当中的时候,很多用户直接说NO,你们这个不是一个主流的网源设备的公司,我怎么可能让你的设备串接到我的链路当中,一旦设备出现了一些问题,可能面临的就是链路的中断、用户大量的告警和业务的损失,但是一切的质疑或者障碍、困难,浩瀚深度公司通过前十几年的努力和时间的验证,我们已经非常成功地迈过去了。但是下一个阶段,我们其实要聚焦于掘金数据的价值,因为要牢牢把握住数字中国建设这一重大的战略机遇,我们要帮助运营商的用户和企业客户快速的构建PB级海量数据的处理平台,并能够充分地、智能化地、合规安全地用好数据。 大数据应用的行业尤其是在AI浪潮下面对于数据的需求、渴求,大家都知道运营商是拥有业界质量最高、效果最好的这些动态的数据,但是相对来说怎么把这些运营商所用的数据存量的资本盘活起来能够发挥作用,中国国家从政策、行业、技术到监管到需求,最近5年的时间里面都发生了很多的变化。目前来讲,一方面继续紧盯怎么样服务好直接的客户运营商的客户,让他自己的经营需求、网络智能化的需求能够通过浩瀚深度给他提供的系统能够满足同时我们还在数据要素和数据安全方面扎扎实实做好相应的基础能力的建设,让相关的这些资产真的能够合法、合规、安全、自由的流通,能够真正的发挥出它的作用来,这是我们接下来可能要和运营商客户和行业伙伴,甚至包括和政府的监管机构一起来推动做的一个事情。 接下来大概跟大家分享一下浩瀚深度公司对于AI与数据要素之间的一些思考,上午几个嘉宾都讲到了,现在我们在面临第四次工业革命,它的特点是数字化 、网络化、智能化。我思考的观点跟大家看的不太一样,第一次工业革命机械化主导国家是英国;第二次工业革命特点是电气化,主导国家是德国、法国等欧陆国家,以及美国;第三次工业革命主要的特点是信息化,主导就是美国和日本,我们可以看到在第三次工业革命信息化的时候,实际上欧洲国家就已经落伍了;第四次工业革命从之前的互联网经济时代来讲,大家可以很清楚的看到日本也落伍了,移动互联网时代兴起之后的互联网时代,数字浪潮这波浪潮下面现在仅剩的玩家只剩美国和中国,这里面有背后的逻辑。 我个人的思考是这样子的,越到后面高阶的工业革命需要有一定的前提条件,显性的有几个:1.必须得要有超大规模人口的数量和市场的容量。2.必须要有大量的科技投入。3.数据的量要非常的多。从这三个基本的要素来讲,实际上我们可以解释为什么在第三次以信息化为标志的工业革命的浪潮里面,日本和欧洲都纷纷落伍,日本总共只有不到2亿的人口,欧洲人口多一点,但是欧洲国家比较小,同时本身这个市场相对比较少,而且在创新方面并没有非常良好的环境。我们作为国内的民营企业在这种时代的背景下面肩负着更艰巨的任务 ,我们必须抓住这个良好的时机要实现弯道超车,抓住历史性的机遇。 在2022年的时候,中央已经发布了一个意见,意思就是说把数据要素定义成主要的五大市场生产要素之一,其他四大是劳动力、土地、资本和技术,我们现在在全世界首先也是唯一一个把数据提到这么高的一个程度,我的理解来讲,既然它是一个生产要素,既然是一个重要的市场要素,基本上来讲应该具备两个特点:第一,如果它是个要素的资产,说明越多越好,质量越高越好,今年中国的人口数量会被印度超过,我们不提人口红利了,我们可以提人口质量的红利,人口多是很好的,但是我们的质量也更重要。第二,土地才能够承载相应的生产力,才能产生出相应的产出,和资本一样,今天有很多二级市场专门做金融的朋友,对于资本来讲肯定是多多益善,这是鲜明的一个特点。 所以说对于数据要素来讲,我们如何充分利用数据、提升数据质量、保障数据安全,这是摆在当前相关产业链里面同行们的一个很显著的课题。 既然是要素资产,它必须具备根本性的一个特点,就是可以流通、可以交易,它的价值才能够释放出来,中国从70年代末开始改革开放,首先是把劳动力解放了,联产承包责任制,农村出现了大量的剩余劳动力,这些剩余劳动力支撑着我们最开始资本的积累,后面是土地的改革,我们现在可能还有很多的硬骨头要去改革,资本市场更不用说了,资本市场上面股权要不能流通,是没有意 义的,前面某一次大牛市就是以改革全流通改革作为出发点,催生了当时非常火爆的行情。现在数据不能很好的流通,这个是我们面临的非常重要的问题。数据不能流通,主要是在监管层面、在应用层面存在很多高压线,存在着很多的陷阱,如果处理不好的话,也许这些方面就会对整个行业产生颠覆性的一个影响。 对于数字中国的整体布局来讲,也把整个数据要素价值的有效释放提到很高的高度,比如从政府机构改革今年新建的一个国家数据局,从我个人的理解来讲 ,过去几年尤其是以《网络安全法》出台为标志,那个时候主要是针对一些行业乱象,例如数据滥用、数据泄露、侵犯个人隐私等等,国家进行了及时而有效的整顿和引导。今年我们要成立国家数据局,我对整个政策文件的学习和我的理解,这个机构是要更好的协调一体推进的格局,把数据的价值让它有序的利用。就跟我们进行相应的政策宣誓,既要设置数据要素、数据交易的警示牌 、高压线,同时我们也得要设立相应的红绿灯,这是从政府顶层设计上很大的一个变化。 从基础设施来讲一个是要夯实数字基础设施和数据资源体系两大基础,另外一个是强化数字技术创新体系和数字安全屏障的两大能力,我认为这两个东西的基础设施实际上是能够支撑未来,不管是现在的AI浪潮,还是未来的大数据应用,它是关键的关键,它是基础的基础,虽然这些东西在冰山下面,今天很多的领导、嘉宾演示了很多炫酷的应用,演示了很多激动人心的场景,但是如果下面的这些基础设施不建设牢固的话,实际上它是存在一些风险的,大楼不能建立在一个沙滩之上,这块也是包括浩瀚深度在内重要的使命和愿景。图片 数据源和接近数据源的公司将成为AI时代真正的受益者,这块也是无需讳言的 ,未来以公共数据为主的高质量、大体量的数据会逐渐的开放,助推AI时代的大浪潮。我们今天很多嘉宾还提到了私域的数据,除了一些公有的大模型,可能还有一些垂直行业的私域的专用knowhow的小模型,目前来讲仁者见仁、智者见智,那是一个发展方向,也许另外一块基础