您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国盛证券]:边缘侧AI产业进展 - 发现报告
当前位置:首页/行业研究/报告详情/

边缘侧AI产业进展

信息技术2024-05-29刘高畅国盛证券S***
AI智能总结
查看更多
边缘侧AI产业进展

OpenAI发布GPT-4o,大模型人机交互能力获重大突破。1)2024年5月13 日,OpenAI推出最新的旗舰模型GPT-4o,可以实时推理音频、视觉和文本,发 布会上OpenAI直播演示了GTP-4o强大的交互能力。2)2024年5月14日,谷 歌IO大会上展示了基于Gemini大模型对AI助手未来的探索项目Astra,演示了 在手机以及眼镜设备上实时推理环境并与用户交互的能力。我们认为,GPT-4o和 Astra是大模型迈向更自然的人机交互的重大进步,带来了崭新的多模态交互能 力,实现了用户体验上的新突破,利好智能终端、机器人等方向。 AI PC产业进展加速,苹果、微软等巨头相继下场。1)2023年英特尔宣布启动 AI PC加速计划,之后英特尔、高通陆续发布AI PC芯片。2)2024年5月7日, 苹果发布M4芯片,用于加速AI任务,配合iPad实现多种AI功能,如实时字幕、 看图查询等。3)2024年5月21日,微软推出专为AI设计的Copilot+PC,拥有 多项强大的AI能力,例如Recall功能可以迅速搜索并用户在PC上访问过的内 容,除了微软的Surface,微软还宣布与宏碁、华硕、戴尔、惠普、联想、三星等 顶级OEM合作,在6月18日起推出全新的Copilot+PC产品。4)分析机构Canalys 预测到2027年,60%的个人电脑将具备AI功能,Windows 10的生命周期计划 于2025年底结束,Canalys认为这将成为企业广泛采用具有AI功能的PC的转折 点。 AI手机及各类可穿戴终端创新不断。1)CounterPoint与联发科等公司共同发布 《生成式AI手机产业白皮书》,预测生成式AI手机将在未来几年保持高速成长, 存量规模将在2027年突破10亿大关。2024年4月,苹果发布Ferret-UI模型, 专为增强对移动UI屏幕的理解而设计,有望改变移动端应用的交互方式。3)其 他终端进展:谷歌宣布Google Research和Fitbit团队正在合作构建个人健康大 型语言模型,为Fitbit智能手表等设备提供个性化智能;据The Information报 道,Meta正在探索开发带有摄像头的人工智能耳机。3)除了AI算法,硬件性能 的提升也是终端智能化的重要动力,高通、联发科陆续推出针对AI的移动端芯 片。我们认为,随着硬件性能以及AI技术的发展,各类终端的智能化程度将不断 提高,新的交互创新会不断涌现,进而带动产业链上下游需求。 建议关注: 1)边缘侧AI相关:中科创达、云天励飞、漫步者、海康威视、大华股份、高通、 联想集团、虹软科技等。 2)算力侧:浪潮信息、寒武纪、海光信息、中科曙光、利通电子、中际旭创、新 易盛、工业富联、高新发展、拓尔思、神州数码、软通动力、协创数据、润建股 份、万马科技、云赛智联、烽火通信等。 风险提示:AI技术迭代不及预期风险;经济下行超预期风险;行业竞争加剧风险。 OpenAI发布GPT-4o,大模型人机交互能力获重大突破 2024年5月13日,OpenAI召开春季更新发布会,推出GPT-4o。 GPT-4o(“o”代表“omni全能”)是OpenAI的新旗舰型号模型,可以实时推理音频、视觉和文本。GPT-4o可以在短短232毫秒内响应音频输入,平均为320毫秒,这类似于人工响应时间。发布会上OpenAI演示了GPT-4o一边语音聊天一边实时解答手写数学问题,以及实时阅读代码并语音指导编程等能力。 图表1:GPT-4o一边聊天一边解答手写数学问题 图表2:GPT-4o实时阅读代码并语音指导编程 2024年5月14日,紧随OpenAI的GPT-4o发布后,谷歌IO大会上展示了其最新的Astra项目,Astra是基于谷歌的Gemini大模型对AI助手未来的探索。谷歌IO大会演示了Astra在谷歌Pixel手机以及智能眼镜设备上运行的效果,终端Agent可以接收源源不断的音频和视频输入,实时推理环境,并在对话中与测试人员就其所看到的内容进行交互。 图表3:Astra项目演示 图表4:Astra还可以将AI添加到智能眼镜中 我们认为,GPT-4o是大模型迈向更自然的人机交互的重大进步,带来了崭新的多模态交互能力,实现了用户体验上的新突破,利好各种智能终端个人助理、机器人等方向。 谷歌紧随其后的Astra项目也进一步验证了大模型赋能终端智能化的产业趋势。 AIPC产业进展加速,苹果、微软等巨头相继下场 2023年10月19日,英特尔宣布启动AI PC加速计划,以加速AI在客户端计算产业的发展速度。“AI PC加速计划”将在2025年前为超过1亿台PC带来AI特性,通过与超过100家ISV合作伙伴深度合作,并集合300余项AI加速功能,英特尔将在音频效果、内容创建、游戏、安全、直播、视频协作等方面继续强化PC的体验。 PC端算力不断强化,助力提升智能化: 2023年12月,英特尔将召开“AIEverywhere”发布会,并推出Meteor Lake处理器。MeteorLake处理器采用英特尔首款集成神经处理单元(NPU),可在PC上实现高能效的AI加速和本地推理。 2023年10月,高通在2023骁龙峰会上推出PC芯片骁龙X Elite,能在设备上运行具有超过130亿个参数的生成式AI模型,并有比竞争对手快4.5倍的AI处理能力。 2024年5月7日,苹果发布M4芯片。M4芯片的极高速神经网络引擎专门用于加速AI任务,运算速度最高可达每秒38万亿次,相比A11仿生芯片中的初代神经网络引擎,提速最高可达惊人的60倍,使之成为处理AI任务的理想芯片,赋能iPadOS中的各种AI功能:例如用于实时音频字幕的实时字幕,以及用于识别视频和照片中对象的视觉查找,新款iPad Pro允许用户在设备上快速完成惊人的AI任务。搭载M4芯片的iPadPro只需轻点一下,即可在Final Cut Pro的4K视频中轻松将拍摄对象与背景隔离开来,并且只需听别人弹钢琴,即可在StaffPad中实时自动创建乐谱。 图表5:M4拥有超快的神经网络引擎,可以轻松将拍摄对象与其背景隔离开来 2024年5月20日,微软推出专为AI设计的新型Windows PC,即Copilot+PC。 微软宣称Copilot+PC是有史以来最快、最智能的WindowsPC。Copilot+PC拥有多项强大的AI能力,其Recall功能可以迅速搜索并用户在PC上访问过的内容,就像拥有照相记忆一样,用户可以跨时间滚动,以在任何应用程序、网站、文档等时间轴中找到所需的内容;使用Cocreator可以直接在设备上近乎实时地生成和优化AI图像;实时字幕功能可以将40+种语言的音频翻译成英语。每台Copilot+PC都配备了用户强大的个人AI Agent,只需使用新的Copilot键唤醒,微软宣布接下来的几周内将从OpenAI那里获得包括GPT-4o在内的最新模型,让用户可以进行更自然的语音对话。 图表6:Copilot+PC的Recall功能展示 图表7:使用Copilot+PC的Cocreator进行艺术创作 除了微软的Surface,微软还宣布与宏碁、华硕、戴尔、惠普、联想、三星等顶级OEM合作,推出全新的Copilot+PC产品。首批Copilot+PC将配备骁龙X Elite和骁龙XPlus处理器,提供强大的性能和电池效率 分析机构Canalys预测到2027年,60%的个人电脑将具备AI功能。Canalys认为,AIPC的早期使用者限于特定的组织类型和员工角色,包括研发人员、开发人员、工程师、数据分析师和艺术家,之后随着时间的推移针对设备端AI处理进行优化的新AI应用程序将激增,包括将现有的基于云的AI应用程序过渡到结合云和本地处理的混合模型,其次在设备上集成人工智能将导致许多人工智能应用程序的价格降低,使更广泛的用户更容易使用它们。 Windows 10的生命周期计划于2025年底结束,Canalys认为这将成为企业广泛采用具有AI功能的PC的转折点。预计到2024年底,最新版本的Windows将发布AI增强功能,并且AI工具将普遍集成到商业和生产力软件中,AIPC市场有望在2025年和2026年大幅扩张。 图表8:Canalys预测2027年60%的PC将具备AI功能 我们认为AIPC在本地运行模型的重要意义包括数据安全保护、更方便的个性化和减少远程服务成本等。AIPC将通过云端和边缘侧计算的协同,大幅提高用户的生产力和创造力,有望打开广阔市场空间。 AI手机及各类可穿戴终端创新不断 2024年5月,CounterPoint与联发科等公司共同发布《生成式AI手机产业白皮书》,白皮书中提出了生成式AI手机的概念,定义了生成式AI手机的必要特征:1)支持大模型的本地部署,或是通过云端协同的方式执行复杂的生成式AI任务,生成式AI手机本身具备强大的AI算力,无须完全依赖云端服务器。2)具备多模态能力,即可以处理文本、图像、语音等多种形式的内容输入,以生成各种形式的输出,典型用例如翻译、图像生成和视频生成等。3)确保流畅、无缝的用户体验,设备能够以自然而直观的交互方式,快速响应用户的请求。4)拥有实现上述特征的硬件规格,包括但不限于基于领先工艺和先进架构设计的移动计算平台,拥有集成或者独立的神经网络运算单元(如APU/NPU/TPU),大容量和高带宽的内存,以及稳定和高速的连接,硬件级和系统级的安全防御。同时CounterPoint预测受益于产业各方积极探索,生成式AI手机将在未来几年保持高速成长,生成式AI手机的存量规模将在2027年突破10亿大关。 2024年4月,苹果发布Ferret-UI模型,专为增强对移动UI屏幕的理解而设计,具备引用、定位和推理能力。目前各类移动应用已经成为人们日常生活的重要组成部分,用户通常需要看着屏幕上应用的UI界面并用手执行对应操作,我们认为随着AI发展,未来有移动端应用的交互方式或将发生巨大变化,用户不需要学习多项应用复杂的UI,只需要用自然语言通过AI助手来调度各类应用。 图表9:Ferret-UI能处理从基础到高级的多种任务,从定位按钮到复杂的推理功能。 2024年3月,谷歌宣布其研究部门GoogleResearch和Fitbit团队正在合作构建个人健康大型语言模型,该模型可以为Fitbit移动应用程序中的个性化健康和保健功能提供支持,帮助人们从Fitbit和Pixel设备的数据中获得更多见解和建议,例如提供个性化的教练功能。 图表10:谷歌FitBit智能手表 2024年5月13日,据外媒TheInformation报道,Meta正在探索开发带有摄像头的人工智能耳机,希望这种设备能用来识别物体和翻译外语。该项目在内部名为camerabuds,目前尚不清楚最终设计是入耳式耳塞还是头戴式耳机。我们认为海外科技厂商的探索,有望令耳机成为重要的AI终端,同时当下耳机市场本身景气度较高:据洛图科技数据,2024年第一季度,中国蓝牙耳机线上监测市场的销量为1757万副,同比增长15.0%;销额为39.1亿元,同比增长16.0%。开放式耳机(OWS)成为行业和企业增长的核心因素,2024年第一季度,OWS开放式耳机在线上耳机市场的份额达到14.4%,较去年同期增长了7.7个百分点,销量同比大幅增长148%,是整体耳机市场的绝对增量。 除了AI算法方面的探索,硬件性能的提升也是各类终端智能化的重要动力: 2023年10月,高通推出新一代移动芯片骁龙8 Gen 3。骁龙8 Gen 3的AI引擎支持多达100亿个参数的生成式AI模型。其图像信号处理(ISP)单元QualcommSpectra可实时生成AI增强的照片和视频,在任何环境中都能提供出色的质量。通过生成式AI声控照片和视频编辑。 图表11:高通骁龙8 Gen 3宣传图 2023年11月,Med