春节期间,全球AI热点涌现,利好频出。OpenAI带头执行AI芯片投资计划并发布文生视频新品Sora,英伟达正式发布此前已经有所展示的AI本地部署RAG工具Chat with RTX,谷歌更新Gemini至1.5版本。 OpenAI宏伟投资计划,剑指改革全球半导体。据华尔街日报消息,OpenAI正在打造全球芯片供应链,来彻底重塑全球半导体行业,Altman一直在关注AI芯片的供需问题,2018年,Altman个人投资了一家AI芯片初创公司Rain Neuromorphics,2019年,OpenAI花费5100万美元购买Rain的芯片; 去年11月,Altman为一家代号为“Tigris”的芯片企业寻求数十亿美元的资金。我们认为,从远期来看,算力需求或持续超出我们的想象,如果仅依靠台积电的先进制程产能进行供应,或难以满足未来AI用户持续增长带来的供应缺口,而另起炉灶,构建一套由OpenAI自己领导的算力产业链,当下来看是OpenAI切入基础设施领域的可行方案。 文生视频大模型Sora横空出世,其能够理解并呈现物理定律,影视动画行业的颠覆性时刻到来。Sora虽然仍旧使用Transformer架构和基于扩散模型,但最大变化在于其能够在生成的视频中展现出火焰反光、物体运动惯性等自然界规律;同时相较于其他扩散模型,视频可以保持相当高的稳定性和一致性,因此,Sora呈现的AI视频给用户一种连续性强、符合逻辑、具有一定观赏性的感觉。最重要的是,Sora依旧符合AI缩尺律(Scaling Law),OpenAI在技术文档中说明,随着训练计算量的增加,样本质量明显提高,进一步佐证了多模态时代,算力需求将成为最核心的瓶颈之一。 Gemini 1.5将实现大模型最大的上下文窗口。相较于Gemini 1.0,1.5最主要的改进是处理大文件的能力,Gemini 1.5 Pro每次可以处理100万个token,结合原生多模态能力,其可以一次性处理大量信息,例如1小时的视频、11小时的音频、超过3万行(或70万个单词)的代码。Gemini基于MoE(Mixture-of-Experts)专家网络,根据给定的输入,MoE模型将选择性地激活其神经网络中最相关的专家路径,从而极大提高模型效率。 Chat with RTX——AI助理的一小步,边缘推理的一大步。该工具可以使用Mistral、Llama 2等开源模型,帮助用户阅读文档/视频并通过检索增强生成(RAG)总结文件内容,全程由本地RTX显卡进行推理。我们认为,边缘推理是AI触及广大潜在用户的“毛细血管”,世界经济论坛在最近的一份报告中预测,能够离线运行生成式AI模型的设备将“大幅增长”,其中包括个人电脑、智能手机、物联网设备等,原因在于,本地模型不仅更加私密,而且与云托管模型相比,本地模型的延迟更低,成本效益更高。 总结来看,近期的AI行业新闻,在模型层面各家激战正酣,同时在Scaling Law不断应验的事实下,我们此前对算力需求充分乐观的观点将持续被验证,AI算力有望继2023年后,继续成为新一年的热门投资方向。 2月22日(下周四)早6:00英伟达将公布上季度财报,建议密切关注。 算力—— 光通信:中际旭创、新易盛、天孚通信、太辰光、腾景科技、光库科技、光迅科技、德科立、联特科技、华工科技、源杰科技、剑桥科技、铭普光磁。 算力调优/调度/租赁:恒为科技、思特奇、中科金财、东方材料、博睿数据、中贝通信、中科曙光、中国移动、中国联通、中国电信。算力设备:中兴通讯、紫光股份、锐捷网络、盛科通信、菲菱科思、工业富联、沪电股份、寒武纪。液冷:英维克、申菱环境、高澜股份、佳力图。边缘算力承载平台:美格智能、广和通、移远通信。卫星通信:中国卫通、中国卫星、震有科技、华力创通、电科芯片、海格通信。 数据要素—— 运营商:中国电信、中国移动、中国联通。数据可视化:浩瀚深度、恒为科技、中新赛克。BOSS系统:亚信科技、天源迪科、东方国信。 风险提示:AI发展不及预期,算力需求不及预期,市场竞争风险。 重点标的 股票代码 1.投资策略:依旧是AI 本周建议关注: 算力—— 光通信:中际旭创、新易盛、天孚通信、太辰光、腾景科技、光库科技、光迅科技、德科立、联特科技、华工科技、源杰科技、剑桥科技、铭普光磁。 算力调优/调度/租赁:恒为科技、思特奇、中科金财、东方材料、博睿数据、中贝通信、中科曙光、中国移动、中国联通、中国电信。 算力设备:中兴通讯、紫光股份、锐捷网络、盛科通信、菲菱科思、工业富联、沪电股份、寒武纪。 云算力:光环新网、奥飞数据、数据港、润泽科技、科华数据。 液冷:英维克、申菱环境、高澜股份、佳力图。 边缘算力承载平台:美格智能、广和通、移远通信。 卫星通信:三大运营商、中国卫通、中国卫星、震有科技、华力创通、电科芯片、海格通信。 数据要素—— 运营商:中国电信、中国移动、中国联通。 数据可视化:浩瀚深度、恒为科技、中新赛克。 BOSS系统:亚信科技、天源迪科、东方国信。 本周观点变化: 春节期间,全球AI行业重磅动态不断,各家新品相继公布,大模型竞争或正步入白热化阶段。进一步细究,我们认为,大模型缩放定律依旧有效,也就是说,AI的性能表现,与计算量、模型参数量和数据规模依旧相关,大模型无论朝何种方向进化,背后的算力需求都是持续增长的。 回想2023年的春节前后,因ChatGPT的出现,让市场于节后聚焦AI,在Q1-Q2实现了最佳的超额收益。而在24年春节前,市场原本对于AI的预期在于业绩兑现度相对较高,本身想象空间并未打开。随着过去一周春节假期全球AI“频放大招”,市场关注点再次回到AI上,有望在节后再掀AI浪潮。我们建议继续重点配置A股算力相关标的,并适当提升风险偏好,节前超跌的AI应用类标的也可以关注。 2.行情回顾:通信板块上涨,光通信表现最佳 春节前(2024年2月5日-2024年2月8日)大盘收于2866点。各行情指标从好到坏依次为:创业板综>中小板综>万得全A(除金融,石油石化)>沪深300>万得全A>上证综指。通信板块上涨,表现劣于大盘。 图表1:通信板块上涨,细分板块中光通信表现相对最优 从细分行业指数看,光通信、量子通信、卫星通信导航、区块链分别上涨10.4%、7.9%、7.2%、4.29%,表现优于通信行业平均水平;通信设备、移动互联、物联网分别上涨4.0%、2.5%、1.7%,运营商、云计算分别下跌0.5%、1.3%,表现劣于通信行业平均水平。 本周受益央企概念,长江通信上涨26.54%,领涨板块。受益光通信概念,新易盛上涨20.66%,受益国企概念,广电运通上涨18.46%,受益超跌反弹,光环新网上涨17.76%、信维通信上涨17.49%。 图表2:本周长江通信领涨通信行业 3.周专题:AI关键词“OpenAI入局算力、Sora与RTX-AI” 春节期间,全球AI热点涌现,利好频出。OpenAI带头执行AI芯片投资计划并发布文生视频新品Sora,英伟达正式发布此前已经有所展示的AI本地部署RAG工具Chat with RTX,谷歌更新Gemini至1.5版本。 OpenAI宏伟投资计划,剑指改革全球半导体。据华尔街日报消息,OpenAI正在打造全球芯片供应链,来彻底重塑全球半导体行业,Altman一直在关注AI芯片的供需问题,2018年,Altman个人投资了一家AI芯片初创公司Rain Neuromorphics,2019年,OpenAI花费5100万美元购买Rain的芯片;去年11月,Altman为一家代号为“Tigris”的芯片企业寻求数十亿美元的资金。我们认为,从远期来看,算力需求或持续超出我们的想象,如果仅依靠台积电的先进制程产能进行供应,或难以满足未来AI用户持续增长带来的供应缺口,而另起炉灶,构建一套由OpenAI自己领导的算力产业链,当下来看是OpenAI切入基础设施领域的可行方案。 文生视频大模型Sora横空出世,其能够理解物理定律,影视动画行业的颠覆性时刻到来。Sora使用Transformer架构,基于扩散模型,能够理解火焰反光、物体运动惯性等自然界规律,同时相较于其他扩散模型,可以保持相当高的稳定性和一致性,因此,Sora呈现的AI视频给用户一种连续性强、符合逻辑、具有一定观赏性的感觉。最重要的是,Sora依旧符合AI缩尺律(Scaling Law),OpenAI在技术文档中说明,随着训练计算量的增加,样本质量明显提高,进一步佐证了多模态时代,算力需求的上限依旧难以想象。 图表3:Sora随着训练计算量的增加,样本质量明显提高 Gemini 1.5将实现大模型最大的上下文窗口。相较于Gemini 1.0,1.5最主要的改进是处理大文件的能力,Gemini 1.0 Pro模型能够处理3.2万个token(约2万个单词),相比之下,Gemini 1.5 Pro每次可以处理100万个token,结合原生多模态能力,其可以一次性处理大量信息,例如1小时的视频、11小时的音频、超过3万行(或70万个单词)的代码。Gemini基于MoE(Mixture-of-Experts)专家网络,根据给定的输入,MoE模型将选择性地激活其神经网络中最相关的专家路径,从而极大提高模型效率。 图表4:主流大模型的上下文长度比较 Chat with RTX——AI助理的一小步,边缘推理的一大步。该工具可以使用Mistral、Llama 2等开源模型,帮助用户阅读文档/视频并通过检索增强生成(RAG)总结文件内容,全程由本地RTX显卡进行推理。我们认为,边缘推理是AI触及广大潜在用户的“毛细血管”,世界经济论坛在最近的一份报告中预测,能够离线运行生成式AI模型的设备将“大幅增长”,其中包括个人电脑、智能手机、物联网设备等,原因在于,本地模型不仅更加私密,而且与云托管模型相比,本地模型的延迟更低,成本效益更高。 图表5:Chat with RTX用户界面 总结来看,近期的AI行业新闻,在模型层面各家激战正酣,同时在Scaling Law不断应验的事实下,我们此前对算力需求充分乐观的观点将持续被验证,AI算力有望继2023年后,继续成为新年的热门投资方向。 4.苹果展示AI新模型MGIE,可一句话精修图片 C114讯苹果公司近日发布了名为“MGIE”的新型开源人工智能模型,它可以根据自然语言指令编辑图像。MGIE的全称是MLLM-Guided Image Editing,利用多模态大型语言模型(MLLM)解释用户指令并执行像素级操作。MGIE可以理解用户下达的自然语言命令,进行Photoshop风格的修改、全局照片优化和局部编辑等操作。苹果公司和加州大学圣巴巴拉分校研究人员合作,在2024年国际学习表征会议(ICLR)上发表MGIE相关研究成果,而ICLR是人工智能研究的顶级会议之一。 MLLM是一种强大的人工智能模型,可以同时处理文本和图像,从而增强基于指令的图像编辑能力。MLLMs在跨模态理解和视觉感知响应生成方面表现出卓越的能力,但尚未广泛应用于图像编辑任务。MGIE通过两种方式将MLLMs集成到图像编辑过程中:首先,它使用MLLMs从用户输入中推导出富有表现力的指令。这些指令简洁明了,为编辑过程提供了明确的指导。例如,当输入“让天空更蓝”时,MGIE可以生成“将天空区域的饱和度提高20%”的指令。 其次,它使用MLLM生成视觉想象力,即所需编辑的潜在表征。这一表征捕捉了编辑的本质,可用于指导像素级操作。MGIE采用了一种新颖的端到端训练方案,可联合优化指令推导、视觉想象和图像编辑模块。MGIE可以处理各种编辑情况,从简单的颜色调整到复杂的对象操作。该模型还可以根据用户的偏好执行全局和局部编辑。MGIE的部分特性和功能包括:基于指令的表达式编辑: MGIE可以生成简洁明了的说明,有效指导编辑过程。这不仅能提高编辑质量,还能增强用户的整体体验。 Photoshop风格