【360智脑大模型】 智脑已经发展到4.0版本。之前都是片段,没有完整系统的发布。 人工智能是为人类社会创造工具,通过工具赋能为行业、产业、国家提高劳动生产力。各家都推出大模型,但基础能力都还在一个起跑线,追赶 GPT4的速度比想象的快。大模型带来产业革命的关键,在于如何让大家使用,如何与场景结合打造更多应用。 大模型之所以叫通用人工智能,在于人类第一次将知识教会给了电脑。Transformer的思路未来不仅仅是语言方面,在自动驾驶、机器人控制、基因、化学等方面都会发挥重要作用。大模型很快会在办公层面提升效率,可以直接提高组织效率,有强大通用性。近期微软发了报告,大模型不会造成大规模失业,可以让人从事务性工作中摆脱出来。 什么样的技术可以产生工业革命? 电脑刚出来的时候给政府、军队用,并不是工业革命,到给个人和企业用的时候,才产生通用的能力,这时候才是革命。大模型只要像电一样输送到千家万户,才能产生革命。大模型要和行业场景深度融合,产业现在才刚刚开始,未来有10年的红利期。所有的网站、APP都会通过AGI重塑一遍。之前大家说只需要一个GPT,但这段时间出现很多个模型。即使是GPT4,问很多通用问题很惊艳,但是问专业问题,很多回答就比较肤浅和油滑,没有深刻的内涵和感情。GPT只是给出正确方向,未来还需要往垂直化、产业化,甚至个人化发展。Google发布四组尺寸不一样的模型,LLaMA模型也在做裁剪的尝试。 360从2015年布局人工智能,2018年开始布局多模态方面积累。2022年,在知识图谱世界杯战胜了图灵战队,获得冠军。 大模型训练步骤:1)找几个和GPT结构相似的开源模型;2)灌进数据和样本,决定了模型未来的能力;3)有监督的微调,用人工和更高级别的模型进行调整。现在模型本身没有门槛,关键在于数据、微调和标注,还有用户使用的反馈,促进大模型的持续训练和迭代。360在这几方面都有天然优势。搜索引擎厂商18年就开始跟进大模型,走的Google路线。OpenAI有执着追求,坚定走解码器路线。搜索引擎厂商当时更侧重具体问题的解决,比如广告和内容的推送。在GPT路线出来以后,我们也把搜索场景的能力搬过来,自然语言处理既是搜索的基础,也是通用人工智能的基础。近期有研究提出世界模型的理论体系,但目前不具备实现可能。GPT路线现在也会有一些缺点,比如知识模糊、数学计算出错等,但是第一次有技术路线可以把世界的知识建立起来,我坚定相信GPT方向。 搜索方面,我们有多源数据的积累。包括中文和英文语料。每天用户会问问题,根据用户问题进行回答,数据质量会更高。 大模型的短板:数据更新不及时、产生幻觉(想象力强,医疗、司法问题容易出问题)。搜索增强可以弥补能力短板,搜索的能力不仅以为着数据的能力,也意味着更新的能力。搜索厂商的工程能力具备优势。场景方面也有优势。 安全能力也是必需的。如何保证GPT不说错话,可以用另一个大模型去监督这个大模型。安全方面存在一定隐患,比如网络内容的真实性,例如明星微博、回复都有可能是大模型生成的。最大的挑战在 于,大模型可以让很低水平的人,经过大模型的帮助,也可以写攻击代码,干坏事的成本降低很多。我们在训练安全行业的智能大脑。研发大模型,可以了解他的原理和来龙去脉,从本质上去解决大模型的安全。360首创大模型安全风险评估体系“AISE”。大模型一味讲发展,不讲安全,是走不远的。360既有人工智能的能力,也有安全的能力,存在优势。 算力方面,我们和BAT不能比,因为他们有云计算业务。我们在A股上市公司中卡是最多的。实际训练中,需要的是Know-how和工程能力,也可以先在百亿模型上验证,后面再到千亿模型上可以用合理资源做合适的模型。 核心还是场景赋能。360过去为中小企业提供安全服务,对中小企业,即使给到他们大模型,也很难赋能。未来也会有Prompt专家,提示词是妨碍中小企业使用的障碍,未来也会有创业公司在这个方面有机会。我们也面向政府和大型企业,他们有很多专有的知识,需要专有的GPT,全球来看蕴含着巨大的机会。行业GPT方面,我们也愿意和有行业数据的合作伙伴合作,我们提供通用大模型的能力,比如修车场景,通过数据训练,可以通过和训练后的GPT对话,使得刚入行的新人获得二十年老师傅的经验。 360智脑目前可开放内测,后续会将各项能力按照导航的方式进行展示。 目前360智脑已经获得信通院首批认证。参与国家标准编写,也积极参与民间评测。目前能力处于第一梯队。现在同行的模型已经基本赶上或接近国际先进的水平。部分中文问题上,我们的表现要比GPT3.5/4更好。今年的高考,10道题我们押中了两题,生成的作文也获得肯定的。 今天发布4.0版本,主要特点是多模态、全端应用、数字人。下个月会发布5.0插件版本,使得大模型有手脚。 下一轮的竞争一定是多模态的竞争。大语言模型有多模态之后,只是的来源就不仅仅是文字,可以来自视频和图片。360智脑目前已经具备多模态能力,可通过与360智脑对话进行图片生成,现场播放:1)文生图(根据文字描述生成图片);2)图生图(例如身份证生成证件照、证件照换背景); 3)图生文(根据图片描述、判断图片不合理的地方); 4)视频理解(检测视频中的车辆、广告牌、检测高层建筑等物体,可增加不同的前缀); 5)文生视频(例如奔跑的野马、企鹅在沙漠中洗澡、熊猫划船等),首发功能,国外现在也只能生成10s的视频。 大模型出来之前,真正的自动驾驶是没有实现的,无论装多少雷达、摄像头,但只是在感知层面,人的工作原理不是这样的,司机看到不同的障碍会做出不同反应。未来大模型也可赋能自动驾驶,帮助实现真正的L4、L5。 360全家桶会全面接入360智脑,包括安全卫士、浏览器、桌面等场景。 现在只是在现有软件上打补丁,未来要以人为本,大模型的使用依赖于Prompt。如果Prompt问的不好,模型效果也不好。 360打造有灵魂的数字人,用360智脑做支撑,有性格、人设、模仿人的经历,未来会有记忆。之前OpenAI也打造了20个数字人,在数字社区里自动产生互动。360打造数字人广场,有200多个角色,可以是明星名人、动漫形象,也可以自己定制。也可以有数字专家、数字助理,比如法律助理、市场 助理。有自己的人设,可以自己学习,连接外部系统。未来数字人不是简单的对口型和念稿,而是真正的和每个人交流。 数字人可具备对应形象的口语和腔调,口型也会变化现场演示和诸葛亮对话 1)“赤壁之战有Iphone会怎么用”:会通过数字人形象进行语音回复,说话风格有时代特点。同时回答如何使用iphone,如通信、预测战局、同时注意信息保密。 2)“为什么不废掉刘禅,取而代之,刘备不也同意你这么做吗?”:回答得体,文言文形式。 3)“你在千年之后成为年轻人的鬼畜素材,你怎么看?”:进行得体回应,并祝愿年轻人。现场演示和孙悟空对话 1)“取经4个人里最喜欢和讨厌谁”:说最喜欢自己,最讨厌猪八戒。 2)“你最喜欢哪个妖精?”:回答了两次,第一次说自己,第二次说白龙马,也说明了喜欢的原因。3)“据说红孩儿是你和铁扇公主生的?”:说红孩儿是太上老君的孩子。 现场演示和马斯克对话(没有演示数字人形象、口音和腔调) 1)“中国电动车产业对你是威胁吗?”:承认有竞争,但会通过创新保持领先; 2)“如何评价推特这家公司?” 3)“SpaceX发射失败对你是重大打击吗?”:不会放弃,将继续改进技术和流程,这次失败提供了宝贵的经验。 现场演示和刘德华对话(没有演示数字人形象、口语和腔调) 1)“你最满意的电影是哪一部?”:无间道 2)“港台明星中,最喜欢哪个女明星?”:张曼玉,同时进行了评价演示和数字员工(法务专员)对话 1)“中小企业如何管理好公章,避免出现风险?”:健全公章制度、严格保管公章、加强监督和检查等 2)“一般合同的审核要点是什么?”:合同约定是否合法、合同形式是否规范、合同履行方式是否可行等 3)“年久失修的牌照过期的汽车,高速驾驶撞上了路边停着的车,被撞的车没有放标识,请问如何界定责任” 可以定制自己的数字人,上传私有知识库,模仿定义的思维方式和语言风格等。现场演示创建周鸿祎数字人的流程,上传照片、发言稿等,后面也可以上传视频,学习其中的知识,形成数字人形象。 现场提问测试周鸿祎-数字人(仅记录要点) Q:你对360发展人工智能有信心吗?为什么?A:投入大量研发资源,取得进展,提到安全能力、数据积累,注重技术的可解释性和安全性。 Q:给360智脑想10个slogan A:“智慧生活从此开始——360智脑与你同行”等。Q:你觉得360股票还能涨吗?现在买还能不能赚钱?A:作为AI助手无法给出投资建议,注意风险等等,比较得体。Q:周鸿祎数字人可以用于哪些场景?A:可以应用于各种场景,家庭控制服务、智能医疗诊断等。