计算机周报20240817 谁是中国AI算力资源“自如” 2024年08月17日 市场回顾 推荐 维持评级 本周(8.12-8.16)本周沪深300指数上涨0.42%,中小板指数下跌0.88%,创业板指数下跌0.26%,计算机(中信)板块上涨0.11%。板块个股涨幅前五名分别为:优博讯、安博通、雷柏科技、GQY视讯、朗科科技;跌幅前五名分别为:任子行、威创股份、*ST博信、汇金股份、彩讯股份。 行业要闻 中国信通院:中国信息通信研究院云计算与大数据研究所云应用与服务团队组织开展研究,编写《中国企业级SaaS产业发展研究报告(2024年)》报告。华为:华夏银行股份有限公司与华为技术有限公司在深圳举行战略合作签约仪式。 分析师吕伟执业证书:S0100521110003邮箱:lvwei_yj@mszq.com 公司动态 相关研究 萤石网络:8月12日消息,公司董事长兼总经理蒋海青先生以集中竞价方式增持公司243,415股份,增股后占持股2,085,815股,直接持有公司股份的0.2649%,蒋海青先生增持计划已实施完成 1.计算机周报20240810:科技内需为王:再次强调自主可控是确定主线-2024/08/102.计算机行业事件点评:政策新方向:算力与电力协同-2024/08/06 艾融软件:8月15日消息,持股5%以上股东孟庆有持有25,681,690股,占公司股份总数12.2079%,拟通过大宗交易方式减持股份不高于6,000,000股,不高于公司股份总数2.8521% 本周观点 3.计算机周报20240804:科技内需为王向工业软件与汽车基础软硬件演绎-2024/08/04 4.计算机行业点评:网络身份认证打开蓝海 市场-2024/07/28 “自如式”算力服务能够有效解决大模型训练、部署、应用环节的痛点,或成为全新范式。作为“自如式”算力服务的领导者,英伟达于GTC2024大会提出的“AIFoundry”具备可随时随地部署、可使用行业标准API进行开发、满足特定领域的模型需求、优化的推理引擎、支持企业级AI、支持多领域AI模型等优势,能够显著降低千行百业AI应用落地的门槛;同时,阿里云与国内几家头部大模型厂商合作,通过在集群架构、功耗散热、资源利用、网络通信、模型算法的综合优化,在模型训练和推理上实现了显著的效能提升,国内“自如式”算力服务渗透率有望进入快速增长的拐点,国内智算中心如火如荼建设提供蓝海市场,建议关注慧辰股份、恒为科技、浪潮信息、中科曙光、星网锐捷、网宿科技等具备AI模型调优与算力调优相结合能力的行业龙头。 5.计算机周报20240727:科技内需为王,信创风云再起-2024/07/27 风险提示政策落地不及预期;行业竞争加剧。 目录 1本周观点3 1.1“自如式”算力服务有望解决AI应用落地的“最后一公里”难题3 1.2英伟达AIFoundry引领“自如式”算力服务发展4 1.3“自如式”算力服务有望进入快速渗透期7 1.4国内AI模型与算力协同优化标杆项目持续落地10 1.5投资建议14 2行业新闻15 3公司新闻16 4本周市场回顾17 5风险提示19 附录20 插图目录21 表格目录21 1本周观点 1.1“自如式”算力服务有望解决AI应用落地的“最后一公里”难题 当前从算力平台建设到模型应用部署面临诸多挑战,新型算力服务呼之欲出。据华为ICT服务与软件微信公众号,区别于传统计算业务,新兴的智能算力平台需要从规划、建设、集成、模型训练到推理的落地,整个过程是一个复杂的系统工程,需要包括:1)大规模集群、软硬一体强耦合的复杂交付,大幅提升了算力平台的设计与实施难度,以及成本、高能耗等挑战;2)模型训练底层机制,理论上决定了训练中断是不可避免,如何稳定训练的时长,故障快速恢复也是重点考虑的问题;3)新兴技术领域,各类软硬件技术都在快速迭代,客户模型训练和应用开发过程中,对底层软硬件的适配调优及专业人才获取上也面临巨大的挑战。 “自如式”算力服务能够高效整合算力资源并灵活满足客户在不同层次的需求,解决AI应用落地的“最后一公里”难题。我们认为租房服务龙头自如成功的核心是专注赚装修和增值服务的钱,而不是像传统二房东一样赚信息差带来的房租差价,因此自如平台的房屋采取统一装修的标准化运营,并提供如房屋清洁、家具维修等各类增值服务;如果把智算中心比作房源,传统的算力运维就像传统二房东一样通过重资产的模式参与智算中心建设,而对后续应用开发的模型调优、应用开发等环节渗透不足,而新型算力服务将业务重点着手于模型调优与算力运维一体化的纯软业务,同时具备在应用侧赋能企业定制开发的高业务扩展性。 图1:“自如式”算力服务梳理 资料来源:民生证券研究院绘制 1.2英伟达AIFoundry引领“自如式”算力服务发展 NVIDIAAIFoundry是一项使企业能够使用数据、加速计算和软件工具创建并部署自定义模型的服务,用于使用企业数据和特定领域的知识构建自定义生成式AI模型。如同台积电代工生产其它企业设计的芯片一样,NVIDIAAIFoundry使企业能够开发自己的AI模型:芯片代工可提供最先进的晶体管技术、制程、大型晶圆代工厂、专业知识以及包含第三方工具和资料库提供商的多元化生态系统;而英伟达AIFoundry包括英伟达创建的AI模型,如Nemotron和Edify等流行的开源基础模型,用于定制模型的NVIDIANeMo™软件,以及由英伟达AI专家构建和支持的英伟达DGXCloud专用计算能力。英伟达AIFoundry的输出形式是一个NVIDIANIM™推理微服务,包括自定义模型、经过优化的引擎和标准API——可随时随地部署。 图2:NVIDIAAIFoundry构建AI模型的流程 资料来源:NVIDIA官网,民生证券研究院 NVIDIAAIFoundry通过提供模型调优与算力调优的一站式服务,赋能AI走入千行百业。NVIDIANIM作为NVIDIAAIEnterprise的一部分,使得企业可以在云、数据中心、工作站和PC上运行AI模型。NVIDIAAIFoundry使用企业数据以及合成生成的数据来增强和改变预训练基础模型中包含的一般知识。一旦模型经过定制、评估等流程后,就会作为NIM推理微服务输出。NIM微服务通过打包算法、系统和运行时优化并添加行业标准API来简化AI模型部署流程。这使得开发者无需大量定制或专业知识就能够将NIM集成到其现有应用程序和基础设施中。借助NIM,企业可以优化其AI基础架构,以更大限度地提高效率和成本效益,有助于提高性能和可扩展性,同时降低硬件和运营成本。总体而言NVIDIANIM具有以下几点核心优势: 1)可随时随地部署:NIM专为可移植性和可控性而构建,支持跨各种基础设施(从本地工作站到云再到本地数据中心)进行模型部署。其中包括NVIDIADGX、NVIDIADGX云、NVIDIA认证系统、NVIDIARTX工作站和PC; 2)可使用行业标准API进行开发:开发者可以通过符合每个领域行业标准的API访问AI模型,从而简化AI应用的开发; 3)满足特定领域的模型需求:NIM还通过几个关键功能满足了对特定领域解决方案和优化性能的需求。包含特定于领域的NVIDIACUDA库,以及为语言、语音、视频处理、医疗健康等各个领域量身定制的专用代码; 4)优化推理引擎:NIM针对每个模型和硬件设置利用经过优化的推理引擎,在加速基础设施上提供尽可能低的延迟。降低了在扩展推理工作负载时运行推理工作负载的成本,改善了最终用户体验。 图3:NVIDIANIM减少了Llama3.1模型的推理延迟、更快地生成token 资料来源:NVIDIA官网,民生证券研究院 5)支持企业级AI:作为NVIDIAAIEnterprise的一部分,NIM采用企业级基础容器构建,通过功能分支、严格的验证、通过服务级别协议提供的企业级支持以及针对CVE的定期安全更新,为企业AI软件提供坚实的基础; 6)支持多领域AI模型:包括NVIDIAAI基础模型和NVIDIA合作伙伴提供的定制AI模型。NIM支持多领域的AI应用,包括大型语言模型(LLM)、视觉语言模型(VLM),以及用于语音、图像、视频、3D、药物研发、医学成像等的模型。 图4:NVIDIANIM推理微服务组成部分 资料来源:NVIDIA官网,民生证券研究院 Amdocs使用英伟达AIFoundry,通过模型微调与算力调优的功能实现了AI精度提高30%的同时运营成本和使用延迟大幅度降低。Amdocs使用Llama2-7b-chat、Llama2-13b-chat和Mixtral-8x7bLLM来增强具有意向分类和账单问答功能的客户服务聊天机器人,Amdocs设计了带有说明的提示,其中包括目标账单(原始XML格式的连续一到两个计费月)和问题。通过AIFoundry,Amdocs实现了显著的AI性能提升: 1)AIFoundry基于NVIDIATriton推理服务器和使用TensorRT-LLM对NVIDIAGPU上的LLM推断进行优化,结合PEFT、LoRA、多种模型混用的方法实现AI相应准确度提升30%; 2)通过对数据格式的整理,tokens消耗降低了40%-60%; 3)通过讲Llama2-13b型号部署在一个GPU上,而Mixtral-8x7B部署在两个GPU上的算力调度方式使得AI均推理速度比领先的最先进的托管LLM服务快4-6倍。 图5:Amdocs使用AIFoundry打造聊天机器人 资料来源:NVIDIA官网,民生证券研究院 1.3“自如式”算力服务有望进入快速渗透期 目前,我国正在大力推进智算中心和智算网络的建设,以进一步完善算力产业链上的基础设施。智能计算中心作为大规模智能计算集群的所在地,不仅具备处理网络数据的能力,还能成功地将计算任务更智能地并行化处理,以高效能源为动力,可以根据不同地区的计算能力需求进行灵活调度和分配。这些措施有效地提升了我国的算力水平,为数字经济的发展提供了强有力的支撑。 合作方 中心名称 地域 算力 建设情况 青岛“海之心”人工智能计算中心 山东省青岛市崂山区 混合精度 建设中 长沙人工智能创新中心硅立方 湖南省长沙市 混合精度 已建成 中科 万达开先进计算中心 四川省达州市 混合精度 已建成 曙光 宜昌先进计算中心一期 湖北省宜昌市 混合精度 已建成 芜湖一体化智算中心 安徽省芜湖市 混合精度 建设中 合肥先进计算中心“巢湖明月” 安徽省合肥市 混合精度 已建成 北京昇腾人工智能计算中心 北京市门头沟区 一期100PFLOPS(短期500P,远期1000P) 已建成 中原人工智能计算中心 河南省郑州市 计划100PFLOPS 已建成 未来人工智能计算中心 陕西省西安市雁塔区 一期规划300PFLPOSFP16 已建成 成都人工智能计算中心 四川省成都市 300PFLOPS(最终1000P) 已建成 武汉人工智能计算中心 湖北省武汉市东湖区 100PFLOPS 已建成 重庆人工智能计算中心 重庆科学城 一期400PFLOPS 已建成 长沙人工智能计算中心 湖南省长沙市高新区 200PFLOPS(25年达1000P) 已建成 横琴人工智能超算中心 广州省珠海市横琴区 1.14EopS(完全建成4EopS) 已建成 杭州人工智能计算中心 浙江省杭州市 40PFLOPS(后期100P) 已建成 南京鲲鹏·昇腾人工智能计算中心 江苏省南京市 800POpS 已建成 济南人工智能计算中心 山东省济南市 / 已建成 青岛人工智能计算中心 山东省青岛市 100PFLOPS 已建成 天津人工智能计算中心 天津市河北区 300PFLOPS 已建成 河北人工智能计算中心 河南省廊坊经济开发区 100PFLOPS 已建成 大连人工智能计算中心 辽宁省大连市 100PFLOPS 建设中 沈阳人工智能计算中心 辽宁省沈阳市 100PFLOPS(后期300P) 已建成 中国-东盟人工智能计算