底层硬件加速创新,驱动AI变革:2023年12月6日,AMD在“Advancing AI”发布会上发布MI300系列、锐龙8040系列以及ROCm 6,意图打破英伟达垄断地位。英特尔预计于12月14日的“AI Everywhere”发布会上发布Meteor Lake,即采用分离式模块架构的AI PC处理器,引领AI PC变革。SK海力士LPDDR5T已在Vivo X100系列落地商用,三星官宣明年开始量产LPDDR5T芯片,预计第六代LPDDR产品有望进一步提升端侧对AI大模型的底层支撑能力。高通在2023年骁龙峰会宣发第三代骁龙8和骁龙X Elite,助力移动终端AI功能加速升级。 AI赋能,智能终端或迎百花齐放:英特尔、联想、华硕等厂商大力推动AI PC落地进程,英特尔即将发布面向下一代AI PC的酷睿Ultra处理器、联想将推出可运行个人大模型Lenovo AI Now的AI PC、华硕将推出首款搭载酷睿Ultra的灵耀14,根据IDC预测,预计到2027年中国PC新机中AIPC渗透率将高达81%,“AI+PC”势不可挡。AI搅动手机市场,Vivo X100系列手机搭载AI蓝心大模型、荣耀全新Magic OS系统落地多项AI端侧应用、小米打造AI大模型全渗透的“人车家全生态”操作系统、三星即将推出搭载自研高斯大模型的AI手机Galaxy S24、华为Mate60引入基于盘古大模型的小艺AI智能助手等。AI赋能可穿戴设备加速迭代,AIPin引领智能终端交互体验创新、WHOOP Coach智能手环利用GPT-4护航个人健康、Meta推出AI赋能的智能眼镜与头显、Rewind吊坠借助AI对现实对话进行智能存储捕捉。 投资建议:建议关注赋能终端加速迭代的软件公司如虹软科技、中科创达,终端核心参与者如传音控股、漫步者、石头科技、萤石网络、创维数字等。 风险提示:宏观环境波动风险、技术创新不及预期风险、行业竞争加剧风险 1底层硬件加速创新,驱动AI变革 1.1AMD发布最新GPU加速卡,意图打破英伟达垄断地位 AMD发布MI300系列、锐龙8040系列以及ROCm 6。2023年12月6日AMD举行“Advancing AI”发布会,正式发布Instinct MI300系列产品,包括MI300X和MI300A,推出锐龙8040系列移动处理器,并介绍了最新的ROCm 6开放软件平台,意图打破英伟达垄断地位,助力AI、HPC(高性能计算)加速迭代。 1)MI300X:单核性能领先英伟达H100。传统风格的纯GPU加速卡,拥有8个XCD核心,304组CU单元,8组HBM3核心,内存容量最大可达192GB,相当于英伟达H100的2.4倍,同时HBM内存带宽高达5.3TB/s,是英伟达H100的1.6倍。MI300X系列加速器的AI性能是英伟达H100的1.3倍、HPC性能是英伟达H100的2.4倍,可为生成式AI工作负载和HPC应用提供领先的性能。此次发布的Instinct MI300X加速器由8个MI300X组成,提供高达1.5TB的HBM3内存容量。 图1.AMD MI300X加速器 图2.AMD MI300X与英伟达H100存储对比 图3.AMD MI300X与英伟达H100AI性能对比 图4.AMDMI300X与英伟达H100HPC性能对比 2)MI300A:全球首款适用于HPC和AI的数据中心APU。产品拥有高性能AMD CDNA 3 GPU内核、最新的AMD“ZEN 4”X86CPU内核以及128GB的HBM3内存容量,内存容量和内存带宽均为英伟达H100的1.6倍。MI300A将CPU和GPU核心集成在一个封装中,统一内存,可实现更高的效率、灵活性和可编程性,在HPC和AI融合的关键工作负载上提供领先的性能。 图5.AMDMI300A加速器 图6.AMD MI300A与英伟达H100存储对比 图7.AMD MI300A与英伟达H100AI性能对比 图8.AMD MI300A与英伟达H100HPC性能对比 3)锐龙8040系列:助力AIPC发展,预计明年初上市。采用“ZEN 4” CPU、RDNA 3 GPU以及XDNA NPU架构,通过提升各部分的效率,进一步提升AI性能。NPU AI性能算力从10TOPS提升到16TOPS,整体算力也从33TOPS增加到39TOPS。8040系列跑Llama 2大语言模型、视觉模型等生成式AI任务的性能是上一代7040系列的1.4倍。与英特尔酷睿i9 13900H相比,锐龙8040系列在多线程处理、游戏和内容创作等方面的性能均更加出色,推动AI PC发展。锐龙8040系列已经出货,相关笔记本产品将在2024年第一季度陆续上市。 图9.AMD锐龙8040系列移动处理器 图10.AMD锐龙8040系列NPU性能提升 图11.AMD锐龙8040系列与英特尔酷睿i9 13900H性能对比 图12.AMD锐龙AI路线图 4)ROCm 6:助力MI300性能释放。通过为AI工作负载提供优化,增加对生成式AI关键功能的支持,包括vLLM、HIP Graph以及Flash Attention等。ROCm 6增强了AMD的AI加速性能,在MI300系列加速器上运行Llama 2文本生成任务时,其AI加速性能比上一代软硬件组合提高大约8倍。 图13.AMDROCm 6的优化 图14.AMDROCm 6的性能提升 图15.AMD MI300X+ROCm 6与上一代软硬件组合性能对比 1.2Meteor Lake即将发布,英特尔希冀引领AIPC时代 采用分离式模块架构的AI PC处理器——Meteor Lake即将发布。英特尔将在12月14日的“AI Everywhere”发布会上正式推出AI PC处理器——Meteor Lake。 Meteor Lake采用分离式模块架构,由CPU模块、SoC模块、GPU模块以及IO模块四个独立模块组成,并通过FOVEROS3D封装技术连接。 图16.Meteor Lake模块架构 图17.Meteor Lake主要亮点 1)CPU模块:首次采用Intel 4制程工艺,与Intel 7相比,能效提高20%以上,使Meteor Lake处理器成为英特尔历史上能效最高的客户端平台;同时能够快速响应,满足轻量级、单次推理、低延迟的AI任务需求。 图18.CPU模块主要亮点 图19.Intel 4与Intel 7的能效对比 2)SoC模块:首次在PC端内置人工智能加速引擎NPU,NPU是一个专用的低功耗AI引擎,能够长时间运行AI。 图20.SoC模块主要亮点 Meteor Lake增加LP E-Core,形成3D性能混合架构。英特尔在SoC模块中专门打造了“低功耗岛”,大部分低功耗的后台工作均在LP E-Core上运行,以便在追求性能的同时降低能耗,延长电池使用时间。增加“低功耗岛”使Meteor Lake形成由LP E-Core、E-Core以及P-Core构成的3D性能混合架构,从而使其拥有更好的线程调度,以及更好的性能和功耗的平衡。 图21.Meteor Lake的3D性能混合架构 图22.Meteor Lake的“低功耗岛” 3)GPU模块:Meteor Lake的每瓦性能是第12代处理器的2倍,同时具有性能并行性和高吞吐量,非常适合媒体、3D应用和渲染通道中的AI计算,可同时处理大量AI任务。 图23.GPU的性能提升 图24.Meteor Lake与第12代处理器的GPU配置对比 4)IO模块:支持与Thunderbolt 4和PCIe Gen5进行连接,能够提供业界出色的连接性能。 图25.IO模块主要亮点 英特尔启动AI PC加速计划。2023年10月19日,英特尔面向全球正式启动AI PC加速计划,以加速AI在客户端计算产业的发展速度。英特尔将联合独立硬件供应商(IHV)和独立软件供应商(ISV),利用公司在AI工具链、协作共创、硬件、设计资源、技术经验和共同推广的市场机会等方面的资源,在2025年前为超过1亿台PC实现人工智能特性,并由将于12月14日发布的英特尔酷睿Ultra处理器MeteorLake率先推动。 图26.Intel AI PC加速计划 1.3SK海力士LPDDR5T已商用,三星明年量产,加速端侧AI发展 SK海力士的LPDDR5T已商用,三星明年将量产。2023年1月,SK海力士宣布公司成功开发出当前速度最快的移动DRAM“LPDDR5T”,并已向客户提供样品。2023年11月,公司宣布正式向客户供应LPDDR5T的16GB容量套装产品,该产品已在联发科技的天玑9300平台完成性能验证,并共同应用于Vivo X100系列智能手机。三星电子副总裁Ha-Ryong Yoon也在近期举行的投资者论坛上宣称公司计划于明年开始量产LPDDR5T DRAM芯片。 LPDDR5T兼具高速度和低功耗,性能提升较大,加速端侧AI发展。LPDDR5T的运行速度高达9.6Gbps,与LPDDR5X相比提升13%。LPDDR5T的16 GB容量套装产品的数据处理速度可达每秒77GB,相当于每秒处理15部全高清电影,同时保持在1.01~1.12V的电压范围内运行,兼具高速度和低功耗的特性。端侧AI技术对移动DRAM的性能要求很高,LPDDR5T成功满足了这部分需求,有助于加速端侧AI发展。后续第六代产品将有望进一步提升端侧对AI大模型的底层支撑能力,推动端侧AI技术迭代升级。 图27.SK海力士LPDDR5T 图28.LPDDR5T与LPDDR5X运行速度对比 1.4高通推出专为AI打造的骁龙8移动平台和骁龙XElite 专为生成式AI打造的第三代骁龙8移动平台正式发布。2023年10月24日,在骁龙峰会上,高通发布其首个专为生成式AI打造的移动平台——第三代骁龙8。 该平台能够支持在终端侧运行100亿参数的生成式AI模型,面向70亿参数大语言模型每秒生成20个token,将带来行业领先的AI、顶尖影像特性、主机级游戏体验以及专业品质音频。搭载第三代骁龙8的Android旗舰终端也已陆续面市,如小米14系列、iQOO 12系列等。 图29.高通第三代骁龙8移动平台 面向PC的骁龙X Elite正式推出,AI性能为竞品的4.5倍。在2023年的骁龙峰会上,高通还推出了公司迄今为止面向PC打造的最强计算处理器——骁龙X Elite。骁龙XElite专为AI打造,配备NPU,能够支持在终端侧运行130亿参数的生成式AI模型,面向70亿参数大语言模型每秒生成30个token,AI处理速度高达竞品的4.5倍。搭载骁龙X Elite的PC预计将于2024年中期上市。 图30.高通推出面向PC的骁龙XElite 2AI赋能,智能终端或迎百花齐放 2.1AIPC时代开启,预计2027年中国PC新机AI渗透率达81% 大模型时代,AI PC即将带来颠覆性的变化。12月7日,以“AI新生态,智启新元年”为主题的首届AI PC产业创新论坛在北京联想总部举办,汇聚众多业界专家和合作伙伴共同探讨AI PC产业的发展。《AI PC产业(中国)白皮书》强调,AI PC将深刻颠覆传统PC的定义,在承担原有的生产力工具和内容消费载体的职能的同时,在功能上由工具属性升级为助理属性,成为个人“第二大脑”,成为与用户如同双胞胎般的个人AI助理。一台真正意义上的AI PC产品,将具备自然语言交互的个人智能体、内嵌个人大模型、标配本地混合AI算力、开放的AI应用生态、设备级个人数据和隐私安全保护五大核心特征。 IDC预测,AI PC在中国PC市场中新机的装配比例将于2027年达到81%,成为PC市场主流。IDC对AI PC的定义是包括处理器集成AI加速引擎的个人电脑和平板电脑。在个人消费市场,AI PC将缩短用户换机周期,加速换机潮的到来,同时改变PC市场的用户人群结构。目前PC消