GPT-4o升级融媒能力,超低延时加速AI应用 2024年5月14日,OpenAI在首次春季发布会发布新旗舰模型“GPT-4o”。 相较于GPT-4,GPT-4o进一步提升了文本、图像及语音处理能力,具有多项升级: (1)多模态交互:GPT-4o是一个多模态大模型,支持文本、音频和图像的任意组合输入,并能生成文本、音频和图像的任意组合输出,具备优秀的多模态交互能力,包括语音、视频,以及屏幕共享。视觉识别方面:GPT-4o可以识别复杂的视觉内容,帮助进行图像分类、物体检测等任务;音频处理方面:能够处理多重语音输入,进行语音识别和生成;视频分析方面,GPT-4o可以理解和分析视频内容,进行视频摘要和标注。 (2)超低延时:GPT-4o的响应速度较快快,最短仅需232毫秒,平均为320毫秒,几乎达到了人类在对话中的反应时间。具备超低延时的同时可以实现对话中实时打断AI,增加信息或开启新话题,可以实时识别和理解人类的表情,文字,以及数学公式;交互语音感情丰富,可以变换语音语调、风格,还可以模仿,甚至“即兴”唱歌;并可以在对话中即时翻译多种语言。 (3)多语言支持:GPT-4o语言处理能力加强,在处理英语和编程语言的文本方面表现与GPT-4 Turbo相当,但在处理非英语语言文本时有显著提升,支持多达20种语言,并能有效减少标记数量,提高处理效率,新的语言标记算法让GPT-4o在多语言环境下更为高效和准确。 (4)性价比升级:GPT-4o性价比进一步提高,所有ChatGPT用户均可免费使用(有使用上限),速度是GPT-4 Turbo的2倍,API成本低50%,速率限制高5倍。 谷歌发布新AI搜索引擎,持续强化AI核心地位 2024年5月15日,谷歌在2024 I/O开发者大会发布多项新AI技术和产品,特别强调了谷歌在AI搜索引擎领域的创新以及其人工智能模型Gemini的多项提升,并展示了AI技术在搜索、图像搜索、工作套件等方面的应用。 (1)发布新AI搜索引擎:谷歌发布了新的AI搜索引擎,包括多步骤推理能力,可以处理复杂的多条件查询,并支持视频搜索。 (2)Gemini模型升级:Gemini 1.5 Pro:提供了全球最长的上下文窗口,能够处理高达200万Tokens,支持超过35种语言;Gemini 1.5 Flash:针对需要快速反应的场景推出,提供高速和高效的数据处理能力;Gemini Nano:将于今年晚些时候在Pixel手机上推出,支持端侧运行,处理文本、图像、声音和口语信息。 (3)新功能和工具:AI旅行规划和数据分析:Gemini将添加新的旅行规划和数据分析功能,提供个性化的建议和见解;Project Astra:一个新的多模态AI项目,能够解释智能手机摄像头捕捉到的物体,并进行交互。 (4)硬件升级:第六代TPU芯片Trillium:提升了处理能力,将与英伟达的最新GPU Blackwell架构配合使用;液冷系统和光纤网络:谷歌在其数据中心部署了大规模的液冷系统,并投资了大量的光纤网络,以支持其AI和云计算服务。 (5)AI助手功能:实时语音和视频交互:Gemini支持实时语音和视频交互,为用户提供更自然的通信体验;定制AI助手Gems:与“谷歌全家桶”产品线整合,提供个性化服务。 风险提示:5G建设不及预期、AI发展不及预期、智能制造发展不及预期、中美贸易摩擦等。 1、周投资观点:AI模型加速迭代升级,重视AI应用带来产 业机遇 1.1、GPT-4o升级融媒能力,超低延时加速AI应用 2024年5月14日,OpenAI在首次春季发布会发布新旗舰模型“GPT-4o”。相较于GPT-4,GPT-4o进一步提升了文本、图像及语音处理能力,具有多项升级: (1)多模态交互:GPT-4o是一个多模态大模型,支持文本、音频和图像的任意组合输入,并能生成文本、音频和图像的任意组合输出,具备优秀的多模态交互能力,包括语音、视频,以及屏幕共享。视觉识别方面:GPT-4o可以识别复杂的视觉内容,帮助进行图像分类、物体检测等任务;音频处理方面:能够处理多重语音输入,进行语音识别和生成;视频分析方面,GPT-4o可以理解和分析视频内容,进行视频摘要和标注。 (2)超低延时:GPT-4o的响应速度较快快,最短仅需232毫秒,平均为320毫秒,几乎达到了人类在对话中的反应时间。具备超低延时的同时可以实现对话中实时打断AI,增加信息或开启新话题,可以实时识别和理解人类的表情,文字,以及数学公式;交互语音感情丰富,可以变换语音语调、风格,还可以模仿,甚至“即兴”唱歌;并可以在对话中即时翻译多种语言。 (3)多语言支持:GPT-4o语言处理能力加强,在处理英语和编程语言的文本方面表现与GPT-4 Turbo相当,但在处理非英语语言文本时有显著提升,支持多达20种语言,并能有效减少标记数量,提高处理效率,新的语言标记算法让GPT-4o在多语言环境下更为高效和准确。 (4)性价比升级:GPT-4o性价比进一步提高,所有ChatGPT用户均可免费使用(有使用上限),速度是GPT-4 Turbo的2倍,API成本低50%,速率限制高5倍。 1.2、谷歌发布新AI搜索引擎,持续强化AI核心地位 2024年5月15日,谷歌在2024I/O开发者大会发布多项新AI技术和产品,特别强调了谷歌在AI搜索引擎领域的创新以及其人工智能模型Gemini的多项提升,并展示了AI技术在搜索、图像搜索、工作套件等方面的应用。 (1)发布新AI搜索引擎:谷歌发布了新的AI搜索引擎,包括多步骤推理能力,可以处理复杂的多条件查询,并支持视频搜索。 (2)Gemini模型升级:Gemini 1.5 Pro:提供了全球最长的上下文窗口,能够处理高达200万Tokens,支持超过35种语言;Gemini 1.5 Flash:针对需要快速反应的场景推出,提供高速和高效的数据处理能力;Gemini Nano:将于今年晚些时候在Pixel手机上推出,支持端侧运行,处理文本、图像、声音和口语信息。 (3)新功能和工具:AI旅行规划和数据分析:Gemini将添加新的旅行规划和数据分析功能,提供个性化的建议和见解;Project Astra:一个新的多模态AI项目,能够解释智能手机摄像头捕捉到的物体,并进行交互。 (4)硬件升级:第六代TPU芯片Trillium:提升了处理能力,将与英伟达的最新GPU Blackwell架构配合使用;液冷系统和光纤网络:谷歌在其数据中心部署了大规模的液冷系统,并投资了大量的光纤网络,以支持其AI和云计算服务。 (5)AI助手功能:实时语音和视频交互:Gemini支持实时语音和视频交互,为用户提供更自然的通信体验;定制AI助手Gems:与“谷歌全家桶”产品线整合,提供个性化服务。 我们认为,OpenAI和谷歌的本次AI更新,表明AIAgent属性不断加强,多模态融合、低时延、长文本的特点不断凸显,需要高度重视AI应用的落地及发展,如AI助手(工作套件)、AI+XR、AI终端等,以及AI发展带来的产业链投资机会。 目前AI算力快速发展,AI军备竞赛持续。随着AI模型持续迭代,模型性能持续优化,AI应用加速落地,模型的训练和推理需求或将持续上升,蓬勃的算力需求有望持续带动算网基础设施建设,建议持续关注AIDC、光模块、液冷温控、AI服务器、交换机、光芯片、光器件、边缘算力等领域投资机会,AI+国产替代推荐标的:宝信软件;光模块推荐标的:中际旭创;液冷数据中心全链条受益标的:英维克;光模块受益标的:新易盛、天孚通信、华工科技、光迅科技、剑桥科技、博创科技、联特科技、德科立等;AIDC受益标的:润泽科技、云赛智联、光环新网、奥飞数据、科华数据、数据港、世纪互联、万国数据等;AI服务器及交换机推荐标的:中兴通讯,受益标的:紫光股份、锐捷网络、烽火通信、盛科通信、菲菱科思、共进股份等;液冷配套设施受益标的:高澜股份、申菱环境、网宿科技、飞荣达、佳力图、同飞股份、依米康等;光芯片及光器件受益标的:源杰科技、光库科技、腾景科技、华西股份、仕佳光子、太辰光、致尚科技、铭普光磁、中瓷电子等;光纤光缆受益标的:永鼎股份、通鼎互联、亨通光电、中天科技等;边缘算力受益标的:广和通、美格智能、移远通信、华测导航、威胜信息、力合微、映翰通、三旺通信、东土科技、和而泰、拓邦股份、高新兴等;AI应用:亿联网络、梦网科技、会畅通讯等。 1.3、市场回顾 本周(2024.5.13—2024.5.17),通信指数下跌0.18%,在TMT板块中排名第三。 2、产业数据追踪 2.1、云计算:仍处于逐步复苏中 (1)全球服务器管理芯片供应商龙头Aspeed 2024年3月营收同比增长58.99%,环比增长22.93%; (2)2024Q1海外五大云巨头(亚马逊、谷歌、苹果、微软、Meta)资本开支为463亿美元,同比增长25.7%,环比增长2.1%;BAT 2023Q4总资本开支为200.41亿元,同比增长38.43%,环比增长20.12%;阿里2023Q4购置物业及设备资本开支为72.86亿元,同比增长25.77%,环比增长77.19%;腾讯2023Q4资本开支为75.24亿元,同比增长33.14%,环比减少6.01%;百度2023Q4资本开支为36.60亿元,同比增长89.74%,环比增长3.71%; (3)2023Q4,Equinix机柜平均价格为2230美元/机柜/月,价格持续上升; 2023Q4,万国数据机柜价格为2085元/平米/月,环比持续下降;2023Q4,世纪互联机柜价格为9477元/机柜/月,价格略有回落。 2.1.1、云计算:Aspeed月度营收情况 图1:2024年3月Aspeed月度营收持续改善(百万新台币) 2.1.2、云计算:BAT季度资本开支情况 图2:2023年第四季度BAT资本开支环比持续增长 图3:2023年第四季度百度、阿里、百度资本开支同比增长(百万元) 2.1.3、云计算:海外云巨头(亚马逊、谷歌、苹果、微软、Meta)资本开支 图4:2024年第一季度海外云巨头(亚马逊、谷歌、苹果、微软、Meta)资本开支持续增长(亿美元) 2.1.4、云计算:Equinix、世纪互联、万国数据机柜价格 图5:Equinix机柜价格呈上升趋势(美元/机柜/月) 图6:万国数据机柜价格持续下降(元/平米/月) 图7:世纪互联机柜价格略有回落(元/机柜/月) 2.2、5G:2024年3月底,我国5G基站总数达364.7万站 2024年3月底,我国5G基站总数达364.7万站,比2023年末净增27万站; 2024年3月三大运营商5G套餐用户数达13.96亿户,同比增速有所放缓;2024年2月,5G手机出货1253.2万部,占比87.9%,出货量同比下降29.21%。 2.2.1、5G基建:5G基站建设情况 图8:5G基站持续建设,占比超三成(万站) 2.2.2、5G基建:三大运营商5G用户数 图9:2024年3月末三大电信运营商5G用户数达13.96亿户(百万户) 图10:移动、电信、联通5G用户数持续增长(百万户) 2.2.3、5G基建:国内手机及5G手机出货量 图11:5G手机出货量有所下滑(万部) 2.3、运营商:创新业务发展强劲 (1)云计算方面,2023年三大运营商数据如下: 1、中国移动:移动云营收达833亿元,同比增长65.6%; 2、中国电信:天翼云营收达972亿元,同比增长67.9%; 3、中国联通:联通云营收达510亿元,同比增长41.6%。 (2)三大运营商ARPU值方面,2023年三大运营商数据如下: 1、中国移动:移动业务ARPU值为49.3元,同比略增0.6%; 2、中国电信:移动业务ARPU值为45.4元,同比略增0.4%; 3、中国联通:移动业务ARPU值为44.0元,同比略减0.7%。 2.3.1、运营商