行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

腾讯云智算套件

2024-08-30 腾讯 CS杨林

腾讯云智算套件

业务挑战

智算中心建设蓬勃发展，企业对AI基础设施本地化需求日益增长。智能算力存在木桶效应，除GPU外，网络、存储等因素同样关键。

方案简介

腾讯云智算套件是腾讯云推出的全栈智算解决方案，旨在帮助用户构建本地化云智算平台。该方案具备高性能、高可用、高性价比特点，并拥有成熟、稳定的完整软硬件智算生态，实现算存网一体化。

方案优势

自研套件全面加持，极致提升AI性能
- 加速框架
  - 训练加速TACO-Train：业界首创混合序列并行技术，FP8训练性能提升20%-45%。
  - 推理加速TACO-LLM：Training-Free预测采样技术，解码速度提升5-10倍，支持70B+大模型极速优化。
- 软件服务
  - 高性能计算集群HCC/CVM/CBM：AI大模型训练性能提升30%以上。
  - 高性能网络IHN：3.2T通信带宽，3分钟拥塞消除，1分钟故障发现、3分钟定位、5分钟自愈。
  - 高性能存储TurboFS：100GBps存储带宽，单客户端5GB/s带宽，百us级延迟。
  - 云原生调度编排TKE qGPU：支持多种容器GPU插件和RDMA网络，解决GPU共享干扰问题。
千锤百炼，成熟稳定
- 历经公有云百万客户及腾讯内部超700个应用验证，1:1迁移至私有化场景，满足企业私有环境智能算力需求。

应用场景

自然语言处理
- AIGC大模型训练：支持泛互、出行、金融等行业，应用于人机对话、智能客服、文本分析、情感分析等场景。
科研计算
- 支持高校、研究院、药企等客户，应用于AI制药、电力仿真、分子动力学仿真等场景。
自动驾驶训练
- 支持终端车企、解决方案商客户，应用于自动驾驶目标检测、AI感知决策等场景。

腾讯云智算套件企业本地化专属智算云业务挑战智算中心建设如火如荼AI基础设施本地化的诉求日趋强烈智能算力存在木桶效应，发布算力不止于GPU，网络、存储等因数同样影响重大方案简介全栈智算解决方案腾讯云智算套件是腾讯云专门帮助用户构建本地化云智算平台，具备高性能、高可用、高性价比，以及成熟、稳定、具备完整软硬件智算生态的算存网一体智算解决方案。方案优势 1. 自研套件全面加持，极致提升AI性能加速框架自研加速套件一键加速AI性能训练加速 TACO-Train 简明易用的AI训练加速引擎，高效使能FP8训练，为不同规模模型训练速度带来20%-45%的显著提升。业界首创混合序列并行技术，开创5D并行新时代。推理加速 TACO-LLM 开创性Training-Free的预测采样技术，大幅提升解码速度，逼近GPU算力上限。特色量化方案及prefill加速及独家70B+大模型极速优化方案，助力十数业务场景极致性能。性能综合提升5-10倍。软件服务完整软件服务覆盖智算全周期高性能计算集群 HCC CVM CBM 软硬件协同优化的完整解决方案，具备数据读取快、网络交换快、训练计算快等技术特点，可使AI大模型训练性能提升30%以上。高性能网络 IHN 软硬一体化协同加速、3.2T通信带宽、3分钟内完成拥塞消除。网络故障1分钟发现、3分钟定位、5分钟自愈。高性能存储 TurboFS 100GBps存储带宽、单客户端性能达5GB/s带宽、百us级延迟，高性能大模型的高性能存储底座。云原生调度编排 TKE qGPU TKE支持多种容器GPU插件和RDMA网络，显著提升部署和开发效率；qGPU可从根源解决GPU共享干扰问题，吞吐接近0损耗。 2. 千锤百炼，成熟稳定腾讯云推出历经公有云百万客户及腾讯内部超700个应用的千锤百炼，1:1输送到私有化场景，满足企业私有环境下智能算力要求的算存网一体智算解决方案。应用场景丰富全面的业务场景自然语言处理 AIGC大模型训练通过AI生成创造性文本、图像、音乐、3D交互内容等场景，为企业提供大模型训练支持支持泛互、出行、金融等客户，在人机对话、智能客服、文本分析、情感分析等场景的训练需求科研计算自动驾驶训练支持高校、研究院、药企等客户，在 A I 制药、电力仿真、分子动力学仿真等场景的训练需求支持终端车企、解决方案商客户，在自动驾驶目标检测、AI感知决策等场景的训练需求了解更多

点击免费查看完整报告

腾讯云智算套件