公司全面拥抱算力,第二增长曲线有望开启 2024年1月智微智能成立子公司腾云智算,专注于提供AIGC高性能基础设施产品的全生命周期服务。凭借一支专业团队,腾云智算致力于AI算力的规划、设计与运维,以及算力设备的供应、租赁、调度和管理。腾云智算在上半年实现净利润9466万元,贡献利润占公司整体的85%。 算力场景一:全链条服务CSP互联网大厂数据中心 CSP行业发展迅猛:公司已与CSP大厂合作。公司围绕AI算力规划与设计、设备交付、运维调优、算力调度管理、设备维保及置换等,提供端到端的智算中心全流程综合服务。目前,公司的服务器业务已经明确与多个大型云计算服务商合作,应用于多个深度学习、大模型训练和深度学习推理的项目中。 算力服务主要包括算力集成及算力优化,智算服务市场规模高增达114.1亿人民币。根据IDC的数据,2023下半年中国智算服务市场整体规模达到114.1亿元人民币,同比增长85.8%。其中,智算集成服务市场规模为36.0亿元人民币,同比增速129.4%。我们认为智微智能有望继续加大在这一领域的投入,形成新的增长点。 算力场景二:机器人边+端控制器 机器人和边缘计算是英伟达未来新的战略方向。英伟达通过Jetson硬件平台为行业客户提供定制化机器人和边缘计算解决方案。NVIDIA Jetson系列产品丰富,提供各种规格的产品以覆盖制造业、建筑业、医疗保健行业和快递行业等各个行业的需求。 类比德赛西威和英伟达在智驾领域合作,我们认为公司有望通过Jetson系列芯片在机器人领域开拓市场空间。智微智能在工业场景Jetson Orin平台推出针对各类机器人的专用控制器。智微智能机器人控制方案已用于多个机器人设备商,方案成熟稳定,并支持深度定制。目前,智微智能在机器人领域针对Jetson Orin系列的三个产品分别推出了针对性的行业解决方案,深度绑定英伟达Jetson Orin系列产品。 投资建议:预计公司2024-2026年营业收入分别为42.27/48.63/55.99亿元,同比增长15.33%/15.04%/15.13%,预计公司2023-2025年归母净利润分别为1.51/2.31/2.62亿元,同比增速分别为361.1%/52.7 %/13.6%。参考可比公司给予公司2025年40xPE,目标市值为92.07亿元,目标价为36.71元,维持“买入”评级。 风险提示:AI服务器需求不及预期的风险;公司在智算集成服务行业的发展不及预期;机器人发展不及预期的风险;行业竞争加剧的风险;预测假设具有一定主观性;该标的近期股价波动较大。 财务数据和估值 1.智微智能:全面拥抱算力,第二增长曲线有望开启 1.1.子公司发力:智微智能第二增长曲线顺利启航 在智微智能发布的2024年半年度报告中,公司不仅巩固了其在传统业务领域的领先地位,更在算力市场领域展现出强劲的增长势头,预示着公司第二增长曲线的明确开启。 公司积极布局算力领域,2024年1月成立子公司腾云智算,子公司专注于提供AIGC高性能基础设施产品的全生命周期服务。凭借一支核心成员拥有20多年行业经验的专业团队,腾云智算致力于AI算力的规划、设计与运维,以及算力设备的供应、租赁、调度和管理。 腾云智算24年1月成立,即在上半年实现净利润9466万元,智微智能又一增长曲线顺利启航。公司在财务领域取得了显著成果,2024年上半年营业收入成功增长至16.89亿元,同比增长3.29%,公司24年H1盈利能力逐步修复,同时归属于上市公司股东的净利润显著提升,为0.56亿元,同比上升36.03%。其中,公司Q2实现收入同比增长16.25%,净利润同比增速达1462.40%。公司Q2收入利润增速对比前两个季度大幅改善,我们判断主要系子公司腾云智算于2季度开始贡献收入利润影响。腾云智算在2024年上半年内为智微智能贡献了0.48亿元的净利润,上半年为归母净利润贡献比例高达85%,成为母公司新的增长极,突显出公司在智算基础设施服务领域的投入已开始产生显著的回报。 图1:公司24年H1盈利能力逐步修复,同比增长36.03% 图2:腾云智算上半年贡献利润占公司整体的85% 2.算力场景一:全链条服务CSP互联网大厂数据中心 2.1.CSP行业发展迅猛:公司已与CSP大厂合作 云服务提供商(Cloud Service Provider, CSP)是提供基于互联网的计算服务的公司,这些服务包括存储、数据库、网络、应用程序和其他功能。通过按需扩展和动态调配资源,用户可以更高效地利用计算资源,降低成本,并加速研发进程。我们认为,在这样的背景下,云服务提供商成为推动AI技术进步和应用落地的关键推动力。 目前,服务器市场正在经历AI服务器高速发展的阶段。随着全球物联网、大数据时代的来临、互联网企业对于数据存储、计算等方面需求呈几何增长,其对服务器的需求也将大幅增加。据华经产业研究院统计预测,2023年全球AI服务器市场规模为211亿美元,预计2025年达317.9亿美元,2023-2025年CAGR为22.7%;2026年全球AI服务器出货量将进一步提升,2022-2026年CAGR将达到10.8%。 公司布局AI服务器,独立推出了AI服务器SYS-60415WG。该服务器基于Intel®高性能工作站W790芯片组,并采用Sapphire Rapids系列处理器,具备显著的性能提升。服务器提供8个DDR5 RDIMM内存插槽,最大支持2TB ECC RDIMM内存,内存读写速率显著提高。支持3个PCIe 5.0 x8和4个PCIe 5.0 x16扩展插槽,可实现灵活扩展。这些优势使得SYS-60415WG在市场上拥有较强的竞争力。 除此之外,公司还依托腾云智算共同开发的AI超算系列服务器SYS-8043,进一步提高市场竞争力。凭借其卓越的性能、创新的架构设计、出色的扩展性和高可靠性,成为深度学习模型训练、推理、高性能计算和数据分析等多个应用场景的理想选择。 图3:SYS-60415WG 图4:SYS-8043 目前,公司的服务器业务已经明确与多个大型云计算服务商合作,应用于多个深度学习、大模型训练和深度学习推理的项目中。我们认为,这些合作不仅巩固了公司的市场地位,也为公司的技术创新和业务扩展提供了强有力的支持。通过与行业领先者的紧密合作,公司既能实现算力业务的进一步拓展,还能不断优化产品性能和用户体验,致力于在AI计算领域取得更大的突破和成就。 2.2.腾云智算:前沿产品问世,展现卓越创新优势 公司围绕AI算力规划与设计、设备交付、运维调优、算力调度管理、设备维保及置换等,提供端到端的智算中心全流程综合服务。客户主要来自于互联网厂商、运营商等,目前公司已经与云工场科技建立生态合作伙伴关系,共同致力于打造“算力+能力”服务体系。 图5:腾云智算与云工场科技共同签署战略合作协议 具体业务模式如下: AI算力规划与设计 行业大模型开发 算力设备供应 算力及数据中心租赁 算力设备维护及现场运维 算力调度及管理平台 AI超算系列SYS-8043: 随着AI模型训练的完成,市场对推理算力的需求急剧上升,尤其是对低延迟的访存密集型任务。为此,腾云智算推出了AI超算系列SYS-8043,这是最新一代5U两路的AI超算服务器系列产品,可支持多种类型人工智能加速卡,满足人工智能不同场景下的算力需求 。 应用场景: 深度学习模型训练:腾云智算的AI超算服务器,拥有卓越的计算能力和优化的存储解决方案,显著提升深度学习模型训练的效率,缩短训练周期。支持多款GPU卡,满足复杂神经网络的高负载训练需求,为高端计算应用提供坚实支撑。 深度学习推理:AI超算服务器系列搭载高性能处理器和迅捷的内存技术,保障了在实时应用场景中深度学习推理的速度与精确度。同时,其设计的可扩展存储系统和先进的网络接口,为处理和传输庞大数据集提供了强有力的支持,确保了在数据密集型任务中的高效率和可靠性。 高性能计算:AI超算系列服务器适用于高负载计算任务如科学计算和工程模拟,提供强大的处理能力和高效的散热解决方案,确保在持续高负载工作状态下的稳定运行 。 数据分析:提供灵活的存储配置和强大的处理能力,适用于大数据分析、数据挖掘等应用。高速网络接口支持大数据的快速传输和处理。 表1:AI超算系列SYS-8043特点产品特点说明强大的计算能力,多样性配置 2.3.算力业务前景广阔:有望提供全链路、全生命周期智算服务 算力优化是指通过各种技术和策略提高计算资源的使用效率和性能,以满足特定应用或工作负载的需求。 随着各家大模型参数规模的逐步扩大,目前各家计算卡集群的规模也在不断成倍增加。以Meta的Llama3 405B为例,Meta官网的信息显示,其基于RoCE的AI集群由24K个GPU组成。 在这一大背景下,算力优化显得尤为关键。如何把宝贵的算力资源发挥到极致,是各家厂商绞尽脑汁攻克的关键领域之一。智微智能作为多家大型CSP厂商的服务器提供商,有望为CSP厂商提供全链路算力优化服务。 对于智算集群的建立来说,需要从底层电力供应到上层的故障监测进行全方面的优化。主要可分为以下几步。 电力供应优化。传统数据中心的设计通常针对X86服务器,单机柜的电力负载通常在20KW以下。然而,随着GPU 8卡服务器的普及,每台服务器的功率已超过10KW,这意味着单个机柜只能容纳1-2台GPU服务器。英伟达推荐的配置是每个机柜4台服务器,这需要超过40KW的电力供应。而在GTC2024上推出的GB200-NVL72设备,其单柜功率需求已突破100 KW,进一步加剧了电力供应的挑战。因此,机柜内部的设备布局以及整个机房的Rack布局设计,必须综合考虑GPU型号、功率需求、电力供应和空间利用等因素,以有效应对这些电力负荷的要求。 图6:服务器机柜布局 图7:4D/5D分布式并行GPU 液冷散热。随着算力集群规模和性能的指数级提升,服务器散热变得至关重要。面对高密度计算带来的热管理挑战,可以引入先进的液冷散热技术。这一变革不仅优化了散热效率,确保了在高负载情况下系统的稳定性和可靠性,而且与传统风冷系统相比,液冷技术还显著降低了能耗,为实现可持续发展的数据中心运营提供了有力支持。 计算层面优化。如图7所示,包括对GPU进行4D/5D分布式并行。在大模型训练领域,4D/5D分布式并行技术是一项关键的创新,它通过在模型、数据、序列和上下文等多个维度上实现并行处理,极大地提升了训练过程的灵活性和效率。这种多维度并行策略允许更细致的GPU资源分配,以实现最优的训练吞吐量。 存储方面的优化。在GPU集群中,存储技术至关重要且充满挑战。公司拥有丰富的存储服务器研发经验,可采用基于NVMe和RDMA的高性能分布式存储方案,以应对实时性要求高的场景,同时通过优化设计实现性能与成本的平衡。 故障监控与定位。在构建复杂系统时,可观测性是必不可少的。在大模型时代的基础设施中,最大的挑战之一在于如何在成千上万的硬件设备中实现快速故障定位,并迅速触发调度系统进行故障隔离。为应对这一挑战,企业需要部署高级的可观测性工具,能够实时监控集群状态,并自动化地识别和隔离故障设备。这不仅能够显著提高集群的利用率,还能减少系统停机时间,确保在大规模运算任务中维持高效的运行。此外,随着集群规模的不断扩大和系统复杂性的增加,故障监控与定位能力的提升将成为维持竞争优势的关键因素。 对于面向大厂的服务器业务而言,提供后续的全链路服务同样重要。在未来几年内,模型参数量将逐步提升。随着大模型对底层算力需求的不断提高,建设和运营万卡集群将成为大模型训练的基本门槛。 算力服务主要包括算力集成及算力优化,智算服务市场规模高增达114.1亿人民币。国际数据公司(IDC)最新发布的《中国智算服务市场(2023下半年)跟踪》报告显示,2023下半年中国智算服务市场整体规模达到114.1亿元人民币,同比增长85.8%。其中,智算集成服务