行业周报|计算机 ARM带来终端智能的广阔前景,Sora开启AI新纪元 计算机行业周观点第1期 核心结论 证券研究报告 2024年02月17日 Arm发布FY24Q3(2023.10.01-2023.12.31)财报,营收大超预期,创历史新高,下游终端AI需求增长为核心驱动之一。 1)2024年2月7日,Arm发布2024财年第三季度业绩,单季度营收达到 8.24亿美元(yoy+14%),创历史新高,此前指引为7.2-8.0亿美元。GAAP毛利为7.88亿美元(yoy+13%),GAAP毛利率为95.6%;Non-GAAP毛利为7.97亿美元(yoy+14%),Non-GAAP毛利率为96.7%。GAAP净利润为0.87亿美元 (yoy-52%),Non-GAAP净利润为3.05亿美元(yoy+36%)。 2)FY24Q3分业务来看,授权(license)业务收入超预期增长,达到3.54亿美元(yoy+18%),主要由于下游终端客户加大对AI的投入,先进ArmCPU需求强劲;版税(Royalty)业务收入创纪录,达到4.70亿美元(yoy+11%)主要由于智能手机市场复苏以及基于ARMv9架构的芯片渗透率迅速提高,Armv9产品的版税通常至少是同等Armv8产品版税的两倍。 3)出货量:2023年7-9月,基于Arm架构的芯片出货量为77亿片(yoy-3%qoq+8%),主要原因为半导体产业边际复苏,移动设备库存逐步消化,汽车行业出货量持续增长。基于Arm架构的芯片累计出货量达到2803亿片。 4)指引:FY24Q4收入指引为8.5-9.0亿美元;FY24全年营收指引为 31.55-32.05亿美元,中间值上调约1.6亿美元。 OpenAI视频生成模型Sora震撼发布,AGI未来已来。Sora可一次性生成60s视频,同时保持极高的一致性;更具突破性的是Sora展现出了对物理世界超强的仿真能力。2月16日,OpenAI发布首个AI视频生成模型Sora并公 布技术报告。Sora是一个扩散模型,同时采用了Transformer架构,其优势在于:1)可实现文生视频、文生图、图生视频以及视频编辑;2)可生成60s的1080P高清视频;3)视频内容丰富,场景复杂,背景及人物塑造逼真,且无论是多角度、近远景切换,还是多镜头,Sora生成的视频都能保持超强的一致性;4)物理世界的模拟器:3D一致性、长期连贯性和物体连续性、与世界互动、模拟数字世界。目前Sora在模拟复杂场景时会出错,并不总能准确呈现物体状态的改变,但OpenAI强调Sora是能够理解和模拟现实世界的模型的基础,这一功能将成为实现通用人工智能(AGI)的重要里程碑投资建议:2024年看好一切终端智能。建议关注:1)芯片:海光信息、寒 武纪;2)终端:软通动力、科大讯飞、金山办公、海康威视、大华股份、 萤石网络。 风险提示:终端智能需求不及预期、AIGC技术突破不及预期、宏观经济增长不及预期、国际环境变化。 分析师 邢开允S0800519070001 13072123839 xingkaiyun@research.xbmail.com.cn 相关研究 计算机:“三省两高一低”优势显著,海底数据中心商用即将开启—算力租赁行业跟踪点评2023-12-29 计算机:看好华为链,静待AI智驾,关注数据要素—2024年计算机行业年度策略2023-11-01 计算机:大模型发展的关键引擎,看好AI算力高景气持续—算力租赁深度研究报告2023-10-10 索引 内容目录 一、ARM带来终端智能的广阔前景3 二、Sora开启AI新纪元,AGI未来已来4 三、行业动态5 四、风险提示7 图表目录 图1:Arm单季度营收及环比变化3 图2:Arm架构芯片出货量3 图3:Arm分业务收入3 图4:Sora生成女人漫步东京街头视频4 图5:Sora生成吃汉堡并留下咬痕的视频5 图6:Sora模拟《我的世界》5 一、ARM带来终端智能的广阔前景 Arm发布FY24Q3(2023.10.01-2023.12.31)财报,营收大超预期,创历史新高。2024年2月7日,Arm发布2024财年第三季度业绩,单季度营收达到8.24亿美元(yoy+14%),创历史新高,此前指引为7.2-8.0亿美元。GAAP毛利为7.88亿美元(yoy+13%),GAAP 毛利率为95.6%;Non-GAAP毛利为7.97亿美元(yoy+14%),Non-GAAP毛利率为96.7%。GAAP净利润为0.87亿美元(yoy-52%),;Non-GAAP净利润为3.05亿美元(yoy+36%)。 2023H1,半导体行业缓慢复苏,智能手机市场需求边际改善,Arm架构芯片出货量逐步回升。Arm在FY24Q3财报中公布上季度(2023年7-9月)基于Arm架构的芯片出货量为77亿片(yoy-3%,qoq+8%),主要原因为半导体产业边际复苏,移动设备库存逐步消 化,汽车行业出货量持续增长。基于Arm架构的芯片累计出货量达到2803亿片。 图1:Arm单季度营收及环比变化图2:Arm架构芯片出货量 营收(左轴,亿美元)qoq(右轴) 9 8 7 6 5 4 3 2 1 0 25%80 20%78 15%76 10%74 5%72 0%70 68 -5%66 -10%64 -15%62 Arm架构芯片出货量(亿片) 资料来源:Arm官网、西部证券研发中心资料来源:Arm官网、西部证券研发中心 下游终端AI需求强劲驱动Arm授权业务收入超预期增长。FY24Q3分业务来看,授权 (license)收入超预期增长,达到3.54亿美元(yoy+18%),主要由于下游终端客户加大对AI的投入,先进ArmCPU需求强劲;FY24Q3,Arm与面向终端市场的半导体公司签署了5份新的Arm总访问协议(ATA),这些公司的产品包括汽车、消费电子和智能手机等;Arm灵活访问协议(AFA)新增6个至218个。版税(Royalty)收入创纪录,达到 4.70亿美元(yoy+11%),主要由于智能手机市场复苏以及基于ARMv9架构的芯片渗透率迅速提高,Armv9产品的版税通常至少是同等Armv8产品版税的两倍。 图3:Arm分业务收入 版税(亿美元) 授权(亿美元) 9 8 7 6 5 4 3 2 1 0 FY22Q4FY23Q1FY23Q2FY23Q3FY23Q4FY24Q1FY24Q2FY24Q3 资料来源:Arm官网、西部证券研发中心 基于对智能手机市场复苏和半导体需求修复的乐观预期,Arm上调营收指引。FY24Q4收入指引为8.5-9.0亿美元,;FY24全年营收指引为31.55-32.05亿美元,中间值上调约 1.6亿美元。 二、Sora开启AI新纪元,AGI未来已来 OpenAI视频生成模型Sora震撼发布,可一次性生成60s视频,同时保持极高的一致性;更具突破性的是Sora展现出了对物理世界超强的仿真能力。2月16日,OpenAI发布首个AI视频生成模型Sora并公布技术报告,Sora是一个扩散模型,同时采用了Transformer 架构。目前Sora在模拟复杂场景时会出错,并不总能准确呈现物体状态的改变,但OpenAI 强调Sora是能够理解和模拟现实世界的模型的基础,这一功能将成为实现通用人工智能 (AGI)的重要里程碑。 1)可实现文生视频、图生视频、文生图以及视频编辑。除了文生视频,Sora支持文生图 (视频的一帧)、图生视频,且可以对已有视频进行扩展,也可以通过插帧的方式连接两个视频;此外,视频尺寸上,Sora可以生成宽屏1920x1080视频、垂直1080x1920视频以及介于两者之间各种尺寸的视频。 2)可生成60s的1080P高清视频,远长于RunwayGen-2以及Pika; 3)视频内容丰富,场景复杂,背景及人物塑造逼真,且无论是多角度、近远景切换,还是多镜头,Sora生成的视频都能保持超强的一致性。Sora制作出的复杂场景,不仅包括多个角色,还有特定的动作类型,以及对对象和背景的精确细节描绘。在Sora生成的60s 的视频中,从全景到女主角脸部特写的近远景切换,以及女主角走路过程中的背景变化,都保持着极强的连贯性和一致性。 图4:Sora生成女人漫步东京街头视频 资料来源:新智元公众号、西部证券研发中心 提示词:一位时尚女性走在充满温暖霓虹灯和动画城市标牌的东京街道上。她穿着黑色皮夹克、红色长裙和黑色靴子,拎着黑色钱包。她戴着太阳镜,涂着红色口红。她走路自信又随意。街道潮湿且反光,在彩色灯光的照射下形成镜面效果。许多行人走来走去。 4)物理世界的模拟器:3D一致性、长期连贯性和物体连续性、与世界互动、模拟数字世 界。Sora能够生成具有动态摄像机运动的三维一致视频,并对短期和长期依赖关系进行 有效建模——可以保留人物、动物和物体的一致性,即使在它们被遮挡或离开画面的情况下也能保持一致。此外,Sora还可以用简单的方式模拟影响世界状况的动作,例如吃汉堡留下咬痕。且Sora还能够模拟人工过程,例如Sora能够在控制《我的世界》中的玩家角色,并以高保真度渲染游戏世界及其动态。 图5:Sora生成吃汉堡并留下咬痕的视频图6:Sora模拟《我的世界》 资料来源:腾讯科技公众号、西部证券研发中心资料来源:腾讯科技公众号、西部证券研发中心 三、行业动态 1、谷歌重磅发布最新一代多模态大模型Gemini1.5系列 2024年2月16日,谷歌DeepMind首席科学家JeffDean以及联创兼CEO的DemisHassabis重磅发布谷歌最新一代多模态大模型——Gemini1.5系列。其中,最高可支持10,000Ktoken超长上下文的Gemini1.5Pro是谷歌迄今为止最强的MoE大模型。在上下文窗口方面,Genmini1.5Pro能够稳定处理高达100万token(极限为1000万token),创下了最长上下文窗口的纪录。对于文本处理,Genmini1.5Pro处理高达530,000token的文本时能够实现100%的检索完整性;在处理1,000,000token的文本时达到99.7%的检索完整性,在处理高达10,000,000token的文本时检索准确性仍然高达99.2%。在音频处理方面,Gemini1.5Pro能够在大约11小时的音频资料中,100%成功检索到各种隐 藏的音频片段。在视频处理方面,Gemini1.5Pro能够在大约3小时的视频内容中,100%成功检索到各种隐藏的视觉元素。此外,谷歌研究人员还开发了一个更通用版本的「大海捞针」测试。在该测试中,模型需要在一定的文本范围内检索到100个不同的特定信息片段。测试结果表明,Gemini1.5Pro在较短的文本长度上的性能超过了GPT-4-Turbo,并且在整个100万token的范围内保持了相对稳定的表现。 2024年2月8日,谷歌Bard聊天机器人重新命名为Genmini,与此同时谷歌迄今为止最强的大语言模型GenminiUltra1.0所加持的AI聊天机器人GenminiAdvanced正式发布。借助GenminiUltra1.0,Germiniadvanced能够近乎完美地胜任编程、逻辑推理、遵循复杂指令、参与创意项目协作等复杂任务。此外,GerminiAdvanced不仅可以开启更长、更详细对话,同时还可以更好地进行上下文理解,在编程能力方面甚至可以和ChatGPT-4相媲美。国外某测试对比了GenminiUltra和ChatGPT-4的编程能力,结果表明:不论是代码的质量和准确性,谷歌Genmini都得到显著提升;在许多细节方面,谷歌Genmini甚至比ChatGPT-4表现更好,在面对更为复杂的代码难题时,前者能更好提供反馈意见、帮助评估不同的编程方法。谷歌已将所有Workspace的所有AI功能整合至Genmini中。在谷歌邮箱中,Genmin