2022上半年度 人工智能行业报告 上海数字大脑研究院 DigitalBrainLaboratory 2022.08 黎瑞刚 CMC资本(CMCCapitalPartners)创➓合伙人 华人文化集团公司(CMCInc.)董事长兼首席执行官 上海数字大脑研究院创➓人 CMC资本创立的上海数字大脑研究院不仅立足技术应用,致力于做出独特的产业贡献,而且我们也期待在国际人工智能发展领域做出前沿的学术贡献,非常高兴在我们的联合创➓人汪军教授的主持下,半年度报告首次发布,希望报告能为行业的信息梳理、方间导引、产业融合发挥积极的作用。 发刊词 汪军 伦敦大学学院(UCL)教授, 上海数字大脑研究院联合创➓人、院长 作为推动多方面升级的新动能,人工智能需要“政产学研资“的全链条协同联 动。本报告从学术、产业发展、资本市场、政策及趋势预测五个维度出发,旨在用发晨的眼光结合过去半年人工智能领域的重要事件为关I人工智能发展的人士给到清晰的发展脉络及超势路径。 学术前沿P5~17 1 “大模型如火如茶,决策大模型与跨任务成为趋势,Alforscience成为挑战目标” 产业发展 2P18~34 “人工智能训练的时间与成本减少,使其应用更加平民化。新技术带来新的应用场景并将惠及更 多产业” 3 资本动态 P35~46 “随着产业的逐步成熟,人工智能投融资活动逐步趋于理性,市场涌现出一批优秀的场景落地型 政策追踪 目录AI公司” P47~61 “美国已布局技术、伦理、政策等体系建设,重视AI对国家安全的影响,中国提出了AI技术标准、产业规划、安全和伦理等方面的要求” 5趋势预测P62~65 “智能决策技术将不断扩充能力边界,全面激活工业数据,成为企业弯道超车的重要驱动力” 论文发表特点 按地区一广中国 全球 市场规模概况广告传媒 按产业领域金融、银行及保险 新技术 决策大模型医疗 多模态学习 人工智能架构 新框架最新进展 1学术前沿产业发展成本降低产业化性价比提高 意识研究 生命科学新应用一 行业发展趋势 大模型脱为热点低代码/零代码 传统和新兴行业AI应用落地加速 能源开发产业整体趋势及热点产业有哪些 产业应用进展国外大公司 大模型是否已形成意识- 世界模型及通用人工智能的讨论 决策智能技术落地的核心问题一 学界讨论 人工智能报告 各机构应用进展国内大公司 国内外创业公司 一国内 就业、国防、城市治理美国- 一数量特点一国外 报告结构 科技伦理中国- 研讨会、行业标准、城市治理英国 研讨会欧盟 教育其他一 4政策追踪3资本动态组分行业分布特点重点投融资事件 投资金额应用场景 5趋势预测 ·从消费互联网到工业互联网 ·AI大模型是必然趋势 ·跨任务、多模态、重交互AI技术向安全关键型产业靠拢 1学术前沿 学术前沿 研究趋势新进展学界讨论 P6~7P8~14P15~17 大模型如火如茶,决策大模型与跨任务成为趋势,Alforscience成为挑战 目标 99 编者按 人工智能学术论文发表量逐年上升,机器学习仍是投稿量最大的主题研究趋势 领域,标志着这两大传统人工智能领域风头正劲。此外,随着人工智能研究范围的不断拓展,以及其他人工智能领域与其他领域的交叉融合,计算机视觉与机器学习领域之外的人工智能论文近年来发表量增速与往年相比有明显提高,标志着人工智能仍是一个年轻的领域,不断有新的研究方向涌现。从总体上看,人工智能各领域论文发表量均逐年上升,标志着该领域的关注度持续增加。 6% 30000 118 22500 15000 7500 23% 17% 2018201920202021 信息论 机器学习人工智能=计算机视觉计算语言学信息论=机器人一机器学习人工智能一计算机视觉一计算语言学 2022年1月至6月人工智能各领域论文发表量占比2018年至2022年人工智能各领域论文发表量超势 ·名词解释· 视动 1arxiv:收繁物理学,学,计算机科学与生物学的论文预即本的文收录网站。 2机器学习:一门多领城交叉学科,研完计算机总样模拟或实现人类的学习行为。以获取新的知识或技能, 3计算机视觉 物的图中投眼讲轩处理加版理能最努用于实标检测,测量和控制的孩术 信息来源:https://anxiv.org/help/stats 强化学习等领域热度持续,可解释AI与可信AI备受关注研究趋势 人工智能领域目前处于高速发展阶段,学术会议成为了领域内研究者交流与发表最前沿技术进展的核心渠道。根据2022年度人工智能领域 顶级会议:国际表征学习大会(ICLR)、国际人工智能联合会议(IJCAI)、美国人工智能协会(AAAI)、国际机器学习大会(ICML)、国际计算语言学学会(ACL)、国际计算机视觉与模式识别会议(CVPR)上的论文发表情况,总结出当前学术前沿的热点与趋势。 会议热点与趋势wTaskMachineTranslation 根据上述会议中接受论文的词频分析以及获奖优秀论文统计结PretrainingLanguage'Model 果,得到以下结论: ContrastiveLearning PretrainedwultiAgent ZeroShot ,强化学习领域发文量持续高涨,在论文中出现频次较高ReinforcementLearning ObiectDetection :对抗训练5、元学习6、多任务学习论文量占比较大 ,神经辐射场方法开➓受到广泛关注,其改进版获得了 Neural..Network GraphNeura] CVPR最佳学生论文提名论文题目词云围 关注问题·名词解释· 4强化学习:机器学习的领域乏一,是一种受行为理学启发,主要关注智能停在与环 通过分析ICLR、IJCAI、AAAI等会议专题论坛的主题,可以境交互过程中通过学习策略以达成园报最大化或实现持定目标的问题 得出人工智能学术界当前关注的关键问题有以下三点:5对抗训练:一神通过向样本中添加嗪声采接升神经网络损型鲁择性和淀化性的乎段。 ·跨领域研究助力可解释AI发展6元学习:一种利用之前学习任务中提取的共性知识(元知识)采学习如何优化学习过程的算法, ,可信AI中的健壮性、隐私性、泛化性及其之间的联系子多任务学习:利用报似任务中的共同点,同时进行学习多神任务的才法。 ,决策算法中的因果公平8神经辐射场:一神可以利用少数凡张静态图像生成多视角的遇真3D图像的2D图像转 3D摄型, 信.8::3§:https://iclr.cc/Conferences/2022,https://aaai.org/Conferences/AAAl-22_https:/jcai-22.org,https://icml.cc/Conferences/2022,https:/cvpr2022.thecvf.com,https:// www.2022.aclweb.org 大模型成为热点:新框架不断涌现,生命科学等领域应用AI解决难题最新进展 根据会议论文发表情况以及业内信息,人工智能最新进展主要集中于人工智能新技术、人工智能新框架与人工智能新应用三个方面: ,在人工智能新技术领域,大模型与多模态学习‘取得重要突破,标志着通用人工智能的实现又进一步 ,在人工智能新框架领域,Google与NVIDIA纷纷布局人工智能架构,从软件框架和硬件设计等多角度加速人工智能计算,进而解放算力 ,在人工智能新应用领域,深度学习与强化学习分别在生命科学领域与能源开发领域大放异彩,助力探索遗传密码,实现人造太阳 DALL-E2 ML-E2i nature ·名词解释· 新技术:DALL-E2使用自然语言编辑图片新框架:深度学习破译造传密码新应用:强化学习控制人造太阳 9大模型:一种使用大数据量训练、具有超大举教量人工智能核型,可以处理多神任务。 10多摸态学习:处理多族态信息(如语音,图像,文本等)的凯器学习方法。 11添度学习:主要基于多层神经网格的机器学习算法 决策领域大模型成为研究前沿 最新进展 GPT系列的诞生标志着百亿级参数量的大模型登上历史舞台。大模型在语言领域发挥重要作用,在视觉领域领域也展现了强大的能力。研究人员希望能够将大模型引入到决策领域,利用其出色的序列建模能力助力决策大模型发展。最近,DeepMind、上海数字大脑研究院、北京大学、上海交通大学及伦敦大学学院的研究人员将大模型应用于决策领域,希望可以基于这项技术研发出类人的通用决策智能体。 DeepMind研发通用Al智能体Gato上海数字大脑研究院等研究使用序列模型求解MARL DeepMind使用决策大模型构建通用智能体Gato,该智能体是一种多模态、多上海数字大脑研究院协同上交、北大、牛津、中科院以及伦敦大学学院的研究人任务、多具身的通用策路。Gato使用同一套权重来处理雅达利游戏、给图片输员,提出了一种被称为MAT的结构,将合作多智能体强化学习问题转换为根据观测出文字描述、聊天、用机橘臂堆叠积木。此外,Gato还能根据任务决定输出形序列求解最优动作序列的问题。 式,无需为每个任务单独训练。 NX Gato Auto-f 智能体Gato可以处理雅达利游戏,图文匹配和聊天等多种任务多智能体决策大模型MAT利用Transformer求解多智能体强化学习 名词解释· 12智能体:任何独立的能够品考祥可以同环境交互的实体。 信息来源:https://www.deepmincpdf/2205.149.53.pd) 多模态学习取得新进展最新进展 现实世界中存在多种模态的信息,例如文本、语音、图片和视频等。具备感知多模态信息能力的AI模型或算法能充分利用环境中存在的信息,并发掘不同模态信息中的联系,综合分析利用信息,从而取得更优秀的效果。多模态学习能够表征不同模态的信息,并且可以根据观察到的模态推知缺失的模态,被认为是更接近人类学习方式,也是一种实现终极人工智能的重要路径。 OpenAl:DALL.E2用自然语言通用多模态大模型BRiVL登上Nature阿里发布最大规模的中文多模态 编辑图像 子刊 预训练模型M6 OpenAI的研究人员发布了一种可以根据自然语言 “悟道”大模型团队借整了人将多模态信息编码为不变的 阿里巴巴联合清华的研究人员提出了中文预训练 措述来生成图像的AI系统DALL.E2,该系统可根 表示方式,遵循弱语义相关假设,构建了一个从互联网上爬 模型M6,该模型参数规模达到1000亿,可以完 提自然语言描速的标题对现有图像进行逼真的编辑 取的庞大数据集训炼模型,提升了模型泛化能力。该工作使 成根据产品描述生成图像,生成诗以及视觉问 和风格变化。 多模态大模型在通往通用人工智能的道路上又推进了一步。 答等任务。 soup Abowlof Prompt 更情呼作者:费李自正文 thatisaportaltoanotherdimensiontTitle:Da (TangDynasty)Text asdigitalart surfing 相见无丑道长, ation,wcdonihavespecifiewords crydaylifc.Oh:Wherccan1findsuchalov Dveryclouehasasilverlining 文字描述及生成的图像BRiVL根据语言描述生成的图片M6生成的诗歇 信.息来:源:https://openai.com/dall-e-2/,http://www.ia.cttbw/202109/t20210927_6215578.html10 Google、NVIDIA布局AI架构最新进展 当今以深度学习为基础的A对算力要求极大,原有的相广的算力利用方式使得算力约束逐渐成为制约AI进一步发展的瓶额。针对该问题, GoOgle、NVIDIA纷纷布局AI架构。在硬件平台上,研发新型计算架构,进一步解放算力,实现“开源”,在软件架构上,充分利用现有算 力资源,实现“节流”。同时,针对特殊任务定制研发计算硬件,在元宇宙等新场景下创建“算力快速通道”。 Google发布