证券研究报告|行业动态点评2023年05月21日 通信:AI大模型为具身智能注入灵魂,有望引领AI新浪潮。具身智能(Embodied Intelligence)是指一种具备自主决策和行动能力的机器智能, 强于大市(维持评级) 它可以像人类一样感知和理解环境,通过自主学习和适应性行为来完成任务。行业走势过往的机器人更多依赖人们手写代码从而在特定场景下完成特定任务,难以 通信 沪深300 与人类进行多维度交互,而通用大模型的突破为人机交互提供新的思路,让人们能够更采用更直接、轻便、灵活的方式对奇迹人实现操控;多模态的引入拓展了交互的丰富性,大幅提升人机交互和环境交互能力,助力机器人能力再上新台阶,未来有望在更多场景落地应用,包括自动驾驶、工业自动化、医疗健康、家用服务、教育、娱乐等众多领域,帮助人类实现极端环境作业、多领域降本增效。我们认为,具身智能有望打开AI新空间,引领人工智能下一站浪潮,建议关注包括数字基础设施及机器人制造等相关环节投资机会。 47%38%30%21%12%4%-5%-13 % 2022-05 2022-09 2023-01 2023-05 作者 计算机:政府学术商界高度重视,AGI可期,北京市政府出台推动AGI发展相关政策征求意见稿,其中重点提及推动具身智能的相关措施。目前,具身智能的研究已广泛拓展到教育、材料、能源等领域,成为未来新一代人工智能理论与应用突破的一个重要窗口。此外,AI大模型浪潮下。谷歌、微软、阿里等巨头均发力探索AI大模型与具身智能的融合。我们看好在政策支持、学术界与商界共同努力下,具身智能有望发挥自身优势,与离身智能结合为实现通用智能打下基础。 分析师 侯宾 执业证书编号:S1070522080001 邮箱:houbin@cgws.com 相关研究 1、《公有云市场竞争白热化,看好国资云厂商份额提升》2023-05-18 2、《本周专题:光联万物智引未来,持续关注光通信产业链投资机会—通信周报》2023-05-15 传媒:关注人机交互带来的行业边际变化。具身智能为传媒行业带来了许多创新和改进的机会。通过将大型语言模型与机器人结合起来,可以实现更便利的人机交互和智能化的内容生成。有望促进传媒行业的数字化转型,并为用户提供更个性化、丰富和沉浸式的传媒体验。 3、《ChatGPT开放联网功能和插件,关注算力、应用等多个环节投资机会》2023-05-15 相关标的: 通信:机器视觉:奥比中光、奥普特、永新光学等;运营商/国资云:中国移动、中国电信、中国联通、深桑达A;主设备商&服务器:中兴通讯、浪潮信息、紫光股份、星网锐捷;光模块:天孚通信、中际旭创、华工科技、新易盛;IDC:英维克、佳力图、申菱环境、润建股份;云计算&大数据:优刻得等;工业互联网:工业富联、东方国信、三旺通信、东土科技、赛意信息、中控技术、宝信软件;卫星互联网:万通发展、海格通信、航天宏图、中科星图;物/车联网:美格智能、鼎通科技、瑞可达、电连技术、移远通信、广和通;PCB/载板:沪电股份、深南电路、兴森科技、世运电路、崇达技术。 计算机:科大讯飞、海康威视、大华股份、金山办公、浪潮信息、同花顺、石基信息、广联达、上海钢联、拓维信息等。 传媒:三七互娱、完美世界、吉比特、蓝色光标、中国科传、中文在线、皖新传媒、中手游、游族网络、万达电影、中国电影、华策影视、智度股份等。 风险提示:技术商业化落地不及预期;政策支持力度不及预期;市场推进不及预期;宏观经济环境恶化风险。 1.通信&计算机:关注相关环节投资机会 1.1具身智能:通向“言出法随”的人机交互之路 具身智能(Embodied Intelligence)是指一种具备自主决策和行动能力的机器智能,它可以像人类一样感知和理解环境,通过自主学习和适应性行为来完成任务。要实现具身智能与环境实时交互并完成自主做事的功能,其所涉及到的主要环节可以抽象理解为包括感知、传输、决策、执行。 感知层类似人的五官,负责收集环境信息,在单一场景下机器或许可以通过感知来绕过决策控制,比如1986年,美国著名机器人制造专家罗德尼·布鲁克斯(Rodney Brooks)研发了第一个基于感知行为模式的轮式机器人,不需要中枢控制可以实现避让、前进和平衡等功能,但是如果想要让机器实现与人类互动并完成多样化指令要求,它面对的可能是结合了语言、图像等多个模态的复杂信息,决策层的多模态处理就显得不可或缺。 决策层作为核心处理枢纽,需要类似人类大脑的处理能力,满足机器在理解指令、分解任务、规划子任务、识别物体完成人机交互和环境交互等方面的需求,多维度的人机交互在传统的机器人领域是一大难题,因而当下的研究更多体现在特定指令下对于环境交互的探索,也即如何更智能地执行特定物理任务上。而ChatGPT等AI大模型的快速突破提供了新的思路,有望充当机器人的大脑与人类进行多维度交互,从而更为出色完成任务。 此外,随着感知和决策的复杂化,传输层对于的实时性的要求日益提升,从而对传输速率和边缘计算等提出更高的需求。 1.2学界广泛研究,AGI可期 上世纪以来,具身智能的研究已广泛拓展到教育、材料、能源等领域,成为未来新一代人工智能理论与应用突破的一个重要窗口。麻省理工学院成立了名为“具身智能”的研究团队进行相关领域的研究。 清华大学刘华平教授等人在《基于形态的具身智能研究:历史回顾与前沿进展》中总结了海内外多方面研究后提出,具身智能(Embodied intelligence)相对于离身智能(Disembodiedintelligence)更侧重关注“交互”,即智能受脑、身体与环境协同影响,并由身体与环境相互作用中,通过信息感知与物理操作过程连续、动态地产生。具身智能未来可望获得突破的发展方向包括形态涌现、感知进化、物理实现、多体协同等,刘教授等人也强调,尽管具身智能很重要,其有着自身的局限性,与离身智能的紧密结合才是实现通用智能的必由之路。 图表1:基于形态的具身智能的体系架构 1.2AI大模型为具身智能注入灵魂,海外互联网巨头纷纷入局 目前已有研究尝试将多模态的大语言模型与机器人结合起来,通过将图像、文字、具身数据联合训练,增强模型对现实中对象的理解,帮助机器人处理具身推理任务。 3月8日,谷歌和柏林工业大学的团队重磅推出了史上最大的视觉语言模型——PaLM-E,参数量高达5620亿(GPT-3的参数量为1750亿)。作为一种多模态具身视觉语言模型(Embodied MultimodalLanguage Model),PaLM-E不仅可以理解图像,还能理解、生成语言,能够利用视觉数据来增强其语言处理能力,从而处理各种复杂的机器人指令而无需重新训练。 在实测中,研究人员展示了PaLM-E可以执行长跨度的任务。比如,面对“从抽屉里拿出薯片”这类指令,PaLM-E可以直接从像素开始对机器人进行规划,结合来自机器人摄像头的视觉反馈,将指令拆解为多个子计划:走到抽屉旁、打开最上面的抽屉、从最上面的抽屉里拿起绿色的薯片、放在柜台上。 图表2:PaLM-E可以执行长跨度的任务 此外,PaLM-E还可以执行规划类任务,比如排列积木。比如排列积木。研究人员根据视觉和语言输入成功地进行多阶段的计划,并结合了长时间范围的视觉反馈,进而让模型能够成功地规划一个长周期的任务「将积木按颜色分类到不同的角落」。如下,在排列组合上,机器人化身为多面手,按颜色将积木排序。 图表3:PaLM-E可以执行规划类任务 谷歌研究人员计划探索PaLM-E在现实世界场景中的更多应用,例如家庭自动化或工业机器人。他们希望PaLM-E能够激发更多关于多模态推理和具身AI的研究。此外,在最近的一项研究中,微软团队在探索如何将OpenAI研发的ChatGPT扩展到机器人领域,从而让我们用语言直观控制如机械臂、无人机、家庭辅助机器人等多个平台。研究人员展示了多个ChatGPT解决机器人难题的示例,以及在操作、空中和导航领域的复杂机器人部署。 其他科技巨头也在探索AI大模型与具身智能的融合。微软在其官网发表的《ChatGPT for Robotics:Design Princ iples and Model Abilities》中公布,他们正探索将OpenAI研发的ChatGPT扩展到机器人领域。在第六届数字中国建设峰会上,张勇透露:阿里云工程师正在实验将千问大模型接入工业机器人,在钉钉对话框输入一句人类语言,即可远程指挥机器人工作。 我们认为,过往的机器人更多依赖人们手写代码从而在特定场景下完成特定任务,难以与人类进行多维度交互,而通用大模型的突破为人机交互提供新的思路,让人们能够更采用更直接、轻便、灵活的方式对奇迹人实现操控;多模态的引入拓展了交互的丰富性,大幅提升人机交互和环境交互能力,助力机器人能力再上新台阶,未来有望在更多场景落地应用。 1.3应用前景广阔,有望开启AI新浪潮,建议关注全产业链投资机会 在5月17日的ITF World 2023半导体大会上,英伟达CEO黄仁勋表示,工智能的下一个浪潮将是具身智能(embodied AI),即能理解、推理、并与物理世界互动的智能系统。 从应用场景来看,具身智能机器人前景广阔,包括自动驾驶、工业自动化、医疗健康、家用服务、教育、娱乐等众多应用领域,帮助人类实现极端环境作业、多领域降本增效。 国内政策也加码推进该领域的发展,5月12日,北京市发布《北京市促进通用人工智能创新发展的若干措施(2023-2025年)(征求意见稿)》,其中便提出探索具身智能、通用智能体和类脑智能等通用人工智能新路径,包括推动具身智能系统研究及应用,突破机器人在开放环境、泛化场景、连续任务等复杂条件下的感知、认知、决策技术。 我们认为,具身智能有望打开AI新空间,引领人工智能下一站浪潮,建议关注包括数字基础设施及机器人制造等相关环节投资机会,相关标的:机器视觉:奥普特、永新光学等;运营商/国资云:中国移动、中国电信、中国联通、深桑达A;主设备商&服务器:中兴通讯、浪潮信息、紫光股份、星网锐捷;光模块:天孚通信、中际旭创、华工科技、新易盛;IDC:英维克、佳力图、申菱环境、润建股份;云计算&大数据:优刻得等;工业互联网:工业富联、东方国信、三旺通信、东土科技、赛意信息、中控技术、宝信软件;卫星互联网:万通发展、海格通信、航天宏图、中科星图;物/车联网:美格智能、鼎通科技、瑞可达、电连技术、移远通信、广和通;PCB/载板:沪电股份、深南电路、兴森科技、世运电路、崇达技术。 2.传媒:关注人机交互带来的行业边际变化 具身智能在传媒领域的应用潜力巨大,可以为传媒行业带来重要的赋能效果。具身智能的发展使得机器人在感知、理解和执行任务方面具备了更强的能力,从而为传媒行业提供了创新和改进的机会 虚拟主持人和演播室:具身智能可以用于创造虚拟主持人和演播室的体验。通过结合计算机视觉、自然语言处理和语音合成等技术,机器人可以模拟人类主持人的形象和声音,实现自动化的节目制作和演播。这可以减少人力成本,并提供更灵活和高效的传媒制作流程。 增强现实和虚拟现实体验:具身智能可以与增强现实(AR)和虚拟现实(VR)技术结合,提供沉浸式的传媒体验。机器人可以作为虚拟导游、陪伴人和互动角色,为用户创造身临其境的体验。这可以用于游戏、旅游、教育和娱乐等领域,丰富用户体验。 具身智能为传媒行业带来了许多创新和改进的机会。通过将大型语言模型与机器人结合起来,可以实现更便利的人机交互和智能化的内容生成。有望促进传媒行业的数字化转型,并为用户提供更个性化、丰富和沉浸式的传媒体验。 风险提示 技术商业化落地不及预期;政策支持力度不及预期;市场推进不及预期;宏观经济环境恶化风险。