上周我们参加了2023北京智源大会,该会议已连续举办五届,本次为第五届,持续两日(6月9日、10日),近百场报告在会上发布。 现场人头攒动,论坛水泄不通。我们注意到本届智源大会人气高涨,多个论坛无处落脚,听众只能在论坛角落或出口站立,或在过道勉强落座。本次会议需提前注册,由主办方北京智源人工智能研究院审核通过才可入会。结合我们的现场调研,参会者多为AI从业者、创业者、高校计算机学子与青年学者。火爆的参会情况反映出当下我国AI产业研究与创新创业方兴未艾、如火如荼之势。 AI顶级盛会,四位图灵奖获得者与OpenAI创始人参会。本届大会规格极高,汇聚了四位计算机界的“诺贝尔奖”——图灵奖获得者,三位“深度学习之父”中的两位(Yann LeCun与Geoffrey Hinton)参会,AIGC明星公司OpenAI创始人Sam Altman与Midjourney创始人也送上了主题演讲。Sam Altman呼吁建立全球统一的AGI(通用人工智能)防护标准。 学界与工业界交相辉映,但资本市场参与度低。论坛关注大模型底层技术、认知科学与应用,学术气息浓厚。我们统计了本届大会发言嘉宾所属机构,发现不考虑各论坛内的重复,130个发言人中,有76位来自高校或科研院所,占58%,47人来自公司或开源社区,占36%,两者共占94%,相比之下,媒体、行业协会、国家部委和投资机构的发言人较少,其中,仅1位来自投资机构。而根据我们的草根调研,来自证券公司或机构投资者的参会者也较少。我们认为,如此有代表性的行业盛会在资本市场的参与和关注度仍然较低,在一定程度上,凸显出AI产业仍然被资本市场低估。 应用、大模型能力评价、并行计算与开源值得重视。1)应用:大会开设了具身智能、自动驾驶等应用主题分论坛。2)大模型能力评价:会上多个团队发布大模型能力评价主题演讲,智源更开源了大模型能力评测体系FlagEval(天秤)中的多模态部分。3)并行计算:相较于AIGC大模型或应用服务商,大会官方合作伙伴多为算力厂商,包括服务器厂商、IDC服务商、国产GPU厂商、云服务厂商,例如国产GPU厂商昆仑芯、浪潮信息等。并且,发言厂商几乎都提到了与大模型相关的多种并行计算方式,如数据并行、流水线并行等。算力服务商英伟达也深度解析了其高效的并 行策略、内存优化技术等。4)开源:HuggingFace、百度飞桨、华为昇思等多个开源框架代表到场参会,开源标杆Linux基金会代表参会,主办方智源开源图、文大模型及大模型能力评测体系。 投资建议:建议关注:1)光模块:中际旭创、新易盛、天孚通信、太辰光、源杰科技、德科立;2)智能模组服务商:美格智能、广和通;3)边缘IDC服务商:龙宇股份、网宿科技;4)光模块服务商:中际旭创、新易盛、天孚通信、源杰科技;5)传统的IoT通信芯片厂商:有望受益行业上行过程。建议关注:中兴通讯、工业富联、翱捷科技、初灵信息;6)应用端标的:恺英网络、神州泰岳、佳讯飞鸿、中科金财等。 风险提示:伦理风险、市场竞争风险、政策法律监管风险。 1顶级盛会,人潮涌动 上周我们参加了2023北京智源大会,该会议已连续举办五届,本次为第五届,持续两日(6月9日、10日),近百场报告在会上发布。 现场人头攒动,论坛水泄不通。我们注意到本届智源大会人气高涨,多个论坛无处落脚,听众只能在论坛角落或出口站立,或在过道勉强落座。本次会议需提前注册,由主办方北京智源人工智能研究院审核通过才可入会。结合我们的现场调研,参会者多为人工智能从业者、创业者、高校计算机学子与青年学者。火爆的参会情况反映出当下我国人工智能产业研究与创新创业方兴未艾之势。 图表1:6月10日上午“生成模型论坛”现场 图表2:6月10日下午“AI开源论坛”现场 1.1AI顶级盛会,四位图灵奖获得者与OpenAI创始人参会 本届智源大会群星荟萃,核心议题包括:图灵奖得主Yann LeCun等领衔探讨大模型发展现状与未来趋势;图灵奖得主Geoffrey Hinton、OpenAI创始人Sam Altman等引领安全伦理问题和风险防范讨论;Google、Meta、Midjourney等代表机构专家共话开源开放创新生态建设。 四位计算机界“诺贝尔奖”——图灵奖获得者、“深度学习三巨头”中的两位 “深度学习三巨头”之一Geoffrey Hinton表示,人工神经网络很快会比真正的神经网络更强大,“activity perturbation(活动扰动)”算法可用于训练神经网络,且节省算力; “深度学习三巨头”之一杨立昆(Yann LeCun)认为,让机器理解世界是如何运作的、并预测它们行动的后果、让机器执行无限步骤的推理链、通过将复杂任务分解为子任务序列来规划复杂任务,是他认为人工智能未来的发展方向,他还强调了推理和规划在人工智能系统中的重要性; Joseph Sifakis认为,目前我们只是拥有弱人工智能水平,它仅能为我们提供构建智能系统的基础要素,但我们并不具备使用它们构建大型智能系统的理论和技术。未来信息通信领域技术ICT和AI之间的加速融合,会导致自主系统的产生,这将是从弱AI跨越到人工智能的一大步,自主系统将超越机器学习系统; 姚期智认为,在考虑如何控制AI的问题前,人类需要先真正解决自身的问题。 对于AI技术,当前正是一个重要窗口。在AGI被创造之前、在军备竞赛开展之前,我们急需形成共识,共同合作搭建一个AI治理结构。 图表3:杨立昆发表主题演讲 图表4:Geoffrey Hinton发表主题演讲 AIGC明星公司创始人 Sam Altman(OpenAI创始人):呼吁国际合作 Sam表示,“我们需要在所有国家对AGI(通用人工智能)的使用建立统一的防护措施,第一步是国际科技界合作,推动增加AGI安全技术进展的透明度。GPT-4花了八个月的时间完成与人类的对齐。OpenAI希望取得的成果之一是可扩展的监督,尝试使用AI系统来协助人类监督其他AI系统;第二个方向是可解释性。”他提到OpenAI计划开源更多模型。 图表5:OpenAI创始人Sam Altman演讲 David Holz(Midjourney创始人) David表示,Midjourney的目标之一是建造新的人类基础设施,使用Midjourney不仅仅是学习如何使用这个工具,而是学习所有的艺术和历史,友好的用户界面可以让人工智能变成用户们自思维的一种延伸。 1.2学界与工业界交相辉映,但资本市场参与度低 论坛关注大模型底层技术、认知科学与应用,学术气息浓厚,发言嘉宾多来自高校与研究机构,其次为公司或开源社区,几乎无投资机构。我们统计了本届智源大会发言嘉宾所属机构,发现不考虑各论坛内的重复,130个发言人中,有76位来自高校或科研院所,占58%,47人来自公司或开源社区,占36%,两者共占94%,相比之下,媒体、行业协会、国家部委和投资机构的发言人较少,其中,仅1位来自投资机构。而根据我们的草根调研,来自证券公司或机构投资者的参会者也较少。我们认为,如此行业盛会在资本市场的参与和关注度仍然较低,在一定程度上,凸显出AI产业仍然被资本市场低估。 图表6:2023智源大会各论坛名与发言人所属机构情况 2应用:热潮始于ChatGPT,不止于聊天和情感陪伴 大量嘉宾不约而同,选择从ChatGPT说起。我们注意到,现场多个嘉宾在演讲开头复盘了ChatGPT 2022年底的上线如何引发了大量关注,回顾了ChatGPT自身的发展史,并且对ChatGPT所采用的基于人类反馈的机器学习(RLHF)等技术细节如数家珍。这反映出ChatGPT在这波AIGC热潮中的开创者地位。 分论坛涉及到的应用方向多样,具身智能、自动驾驶等是热点。例如,AI与生命科学方面,AI可以:1)帮助科学家更快地识别和编辑基因,以研究遗传疾病和生物科技;2)加快药物研发的流程,通过分析大量数据和仿真模拟,预测药物的安全性和功效,从而降低研发成本和时间;3)帮助医生分析和解释医学影像,提高病例诊断和治疗准确性,从而改善医疗质量和效率;4)通过分析个人的生理和健康数据,提供更加准确的健康建议和治疗方案,帮助人们更好地管理自己的健康。AI与自动驾驶方面,AI可以帮助汽车制造商更好地设计和优化自动驾驶系统,提高自动驾驶的安全性和可靠性。例如,通过应用人工智能技术,可以更准确地识别和预测交通状况、行人和障碍物等,从而帮助车辆做出更明智的决策和动作。例如,在本届智源大会上,UCLA助理教授周博磊报告了《基于鸟瞰图的可控和可交互的大规模场景生成》。 图表7:基于鸟瞰图生成路面场景 3模型:“百模大战”,大模型的能力评价成焦点 从大模型涌现之初,研究者们就千方百计地来测试模型的性能,利用人工打分,制作测试题集,利用GPT-4评估……随着越来越多的模型发布和开源,目前人们迫切需要一个标准化的方式来评估模型性能。目前海内外较为知名的测评方法有伯克利大学Chatbot Arena借鉴游戏排位赛机制,让人类对模型两两评价;开源工具包Zeno Build,通过Hugging Face或在线API,使用Critique评估多个大模型;SuperCLUE中文通用大模型综合性评测基准,尝试全自动测评大模型;C-Eval采用1.4万道涵盖52个学科的选择题,评估模型中文能力,但类似标准尚需时间和市场的检验。本届智源大会上,多个团队发布了大模型能力评价主题演讲,智源更开源了大模型能力评测体系FlagEval(天秤)中的多模态部分。 FlagEval(天秤)是一种采用“能力—任务—指标”三维评测框架的大模型评测平台,旨在提供全面、细致的评测结果。该平台已提供了30多种能力、5种任务和4大类指标,共600多个维度的全面评测,任务维度包括22个主客观评测数据集和84433道题目。 图表8:FlagEval大预言模型测评体系 FlagEval(天秤)第一期已推出大语言模型评测体系、开源多语言文图大模型评测工具mCLIP-Eval和开源文图生成评测工具ImageEval。天秤平台还将继续探索语言大模型评测与心理学、教育学、伦理学等社会学科的交叉研究,以期更加科学、全面地评价语言大模型。FlagEval针对大模型开发者和使用者,旨在帮助各个开发团队了解自身模型的薄弱之处,并推动技术创新。 图表9:mCLIP-Eval评估图表 4算力:并行计算热,英伟达积极创新,国产GPU紧追猛赶 大会官方合作伙伴多为算力厂商。我们发现,相较于AIGC大模型或应用服务商,本届智源大会的官方合作伙伴多为算力厂商,包括服务器厂商、IDC服务商、国产GPU厂商、云服务厂商,例如国产GPU厂商昆仑芯、浪潮信息等。我们注意到,发言厂商几乎都提到了与大模型相关的多种并行计算方式,如数据并行、流水线并行等。算力服务商英伟达也深度解析了Megatron与Nemo框架的优化方法,包括其高效的并行策略、内存优化技术等,以及如何利用该框架在大模型时代提高模型开发效率和模型质量。 图表10:2023北京智源大会合作伙伴 5生态:开源力量不可忽视,智源积极开源 HuggingFace、百度飞桨、华为昇思等多个开源框架代表到场参会,主办方智源开源图、文大模型及大模型能力评测体系。开源是AIGC浪潮中的重要力量,在本届大会中也展露无疑,开源标杆Linux基金会相关负责人现身,多个AI开源框架负责人也到场发表主题演讲。 特别地,6月9日,在本届智源大会上,智源发布了完整的悟道3.0大模型系列,并将其推入全面开源新阶段。悟道3.0包含的项目有“悟道・天鹰”(Aquila)语言大模型系列并采用可商用、非Copyleft协议,FlagEval(天秤)大模型语言评测体系以及“悟道・视界”视觉大模型系列。 其中,“悟道・天鹰”Aquila语言大模型继承了GPT-3、LLaMA等的架构设计优点,支持商用许可协议,同时包含了AquilaChat对话模型和AquilaCode文本-代码生成模型。 AquilaC