智能小巨 智 智能小巨人科技 智能小巨人科技 智能小巨人科技 AI商业观察Vol.04 智能小巨人科技 智能小巨人科技 智能小巨人科技 大模型,不止价格战 智能小巨人科技出品2024/05/30 王铮Silvia 智能小巨人科技 北京市朝阳区合生汇3楼 人科技 智能小巨人科技 wangzheng@ainewgiant.com 智能小巨 智 智能小巨人科技 智能小巨人科技 智能小巨人科技 NO.1 大模型,不止价格战 智能小巨人科技 •5月,中美“AI月”,国产大模型“价格战”开打 智能小巨人科技 •各方观点:“降价猫腻多”、“同质化竞争”、“行业洗牌” 智能小巨人科技 •把“大模型价格战”作为商业研究项目,结论却是:大模型,不止价格战! 人科技 智能小巨人科技 智能小巨人科技 learnmore… 人科技 智能小巨人科技 智能小巨人科技 智能小巨 智能小巨人科技 智能小巨人科技 智能小巨人科技 智 智能小巨人科技 智能小巨人科技 智能小巨人科技 国内大模型API降价汇总 调整前价格调整后价格 国内大模型API降价汇总 智能小巨人科技 调整前价格调整后价格 日期公司模型规格 输入输出输入 输出日期公司模型规格 输入输出输入输出 元/千元/千元/千元/百万降幅 tokentokentokentoken 元/千元/百万降幅 tokentoken 元/千元/千元/千元/百万降幅元/千元/百万降幅 tokentokentokentokentokentoken 智能小巨人科技 5月6日深度求索DeepSeek- v2-32k 5月11日智谱GLM-3Turbo-128k Doubao-lite-4k //0.0011/0.0022/ 0.0050.0050.001180%0.001180% //0.00030.3/0.00060.6/ ERNIE Speed-8k ERNIESpeed-APPBuilder ERNIE Speed-128k 百度 0.0040.00800100%00100% 0.0040.00800100%00100% 0.0160.03200100%00100% Doubao-lite-32k 智能小巨人科技 智能小巨人科技 ERNIE0.008 Lite-8k-0922 0.008 0 0 100% 0 0 100% ERNIELite-128k 0.012 0.024 0 0 100% 0 0 100% ERNIETiny-8k 0.001 0.001 0 0 100% 0 0 100% Doubao- //0.00030.3/0.00060.6/ 5月21日 智能云 智能小巨人科技 ERNIELite-8k0.0030.00600100%00100% 5月15日火山引擎 lite-128k//0.00080.8/0.0011/ Doubao- pro-4k Doubao- //0.00080.8/0.0022/ 讯飞 pro-32k//0.00080.8/0.0022/ Doubao-//0.0055/0.0099/pro-128k 5月22日 科大SparkLite0.0180.01800100%00100% Qwen-Turbo 智能小巨人科技 混元-lite 0.008 0.008 0 0 100% 0 0 100% 混元-standard 0.01 0.01 0.0045 4.5 55% 0.005 5 50% 0.0080.0080.002275%0.006625% 人科技 5月21日阿里云 Qwen-Plus0.020.020.004480%0.0121240% 智能小巨人科技 Qwen-Long0.020.020.00050.597%0.002290% Qwen-Max0.120.120.044067%0.121200% 5月22日腾讯云 混元-0.120.120.0151588%0.066050% standard-256k 混元-pro0.10.10.033070%0.11000% 智能小巨 智 智能小巨人科技 智能小巨 智 智能小巨人科技 智能小巨人科技 智能小巨人科技 我们借助各种AI搜索产品收集了几十篇关于“大模型价格战”的深度采访稿件,对AI业内人士的观点进行了梳理: 第一类视角:关于AI生态的上游技术要素。“大模型行业每年降低十倍推理成本是可以期待的”、“大厂烧钱是为了换数据,打造数据飞轮”等等。 智能小巨人科技 智能小巨人科技 智能小巨人科技 第二类视角:从用户价值的角度进行评价。“这反映了大模型行业内现有性能评测标准的缺乏,因为没有评价标准所以拼价格”;“国内大模型API使用起来层层套娃,先免费上车、但还是会跳转到其他收费项目”;“价格因素只是使用大模型的原因之一,还是更关注模型的质量、推理能力、参数和准确率”;“价格战对企业落地大模型是好事,但是仍然没有解决使用大模型到底带来哪些价值的问题”,“即使大模型落地通过预算环节,部署环节的数字化基础薄弱、工程化能力不强怎么解决”。 第三类视角:对本次价格战的竞争性质做了点评。“大模型的性能遇到了瓶颈,只能同质化竞争,需要降价”、“大厂通过烧钱抢大模型市场份额”、“这次降价是B端的降价方法,云厂商的竞争升级了”等等。 人科技 智能小巨人科技 智能小巨人科技 第四类视角:对AI产业生态演变的思考。“巨头在大模型赛道血拼是必然的,技术创业者首先要放弃幻想,如果压力太大,可以选择暂时先战术性‘躺平’一下”;“那些缺少模型差异化能力又没有商业化模式的大模型初创公司会被直接'卷死'”。 差异化路线图。 替代产品新架构AI模型 04大模型“挑战者”机会 从大模型上游要素的供不应求到下游打通模型 部署、API调用、应用落地的全链路中,还有很 多产业环节上的空白;蓝海机遇大于红海竞争。 智能小巨 智 智能小巨人科技 新进入者 AI创业公司 深度求索、智谱AI李开复、王小川 贾扬清、袁进辉…… 供应要素算力、算法、 数据 大模型推理成本用户、场景数据 “在位者”竞争 百度、阿里、字节、腾讯、科大讯飞…… 智能小巨人科技 智能小巨人科技 客户/用户企业、开发者 智能小巨人科技 企业CIO、创业团队、资深开发人员 大模型上游:推理成本、数据生态 智能小巨人科技 01 推理成本快速下降;不缺大模型和技术,缺场景缺数据。 大模型下游:企业、开发者 智能小巨人科技 02AI应用爆发现实挑战众多,降价之外,预计更多AI应用扶持措施和生态系统构建计划在路上。 大模型”在位者”竞争 人科技 智能小巨人科技 智能小巨人科技 03在技术路线、产品服务、应用落地和市场定位等方面,领先的大模型厂商已经选择了各自的 智能小巨人科技 智能小巨 智能小巨人科技 智 NO.2 智能小巨人科技 技术性降本、高性能计算集群与数据飞轮 智能小巨人科技 •大模型推理成本降了多少?“价格战”公司技术性降本能力如何? 智能小巨人科技 •深度求索和智谱AI降价底气:大模型架构和算法策略创新 智能小巨人科技 •“在位者”公司:投入算力管理平台、建设高性能计算集群 •高性能计算集群的规模效应 •“烧钱换数据”,降价意在构建“数据飞轮” 人科技 智能小巨人科技 智能小巨人科技 •一年时间,推理成本降低10-100倍,领先大模型厂商边际成本下降幅度更大 learnmore… 智能小巨人科技 大模型上游 一年的时间里,大模型的推理成本降低了10-100倍,奠定降价基础 人科技 智能小巨人科技 智能小巨人科技 重金投入AI基础设施,又亟缺场景和数据的失衡状态下,必须多管齐下,降低使用门槛,增加用户基数 大模型独角兽通过技术架构创新大幅降低成本: 智能小巨 智 •DeepSeekv2在MoE、RoPE和Attention上有全新的创新; 智能小巨人科技 •智谱AI自主研发GLM预训练架构,采用稀疏激活的MoE架构,并优化模型适配多种高性能硬件平台。 科技巨头与老牌厂商的多重大模型降本策略: •在模型层面进行技术性降本; 智能小巨人科技 •投入算力管理平台、建设高性能计算集群等基础设施来大幅提升算力利用效率。 智能小巨人科技 重金投入的AI基础设施,亟需规模效应: •阿里和腾讯都专门建设了高性能的计算集群; •大规模集群的运维成本分摊到每个计算任务上更为经济; •大规模集群支持灵活的资源分配和调度,高利用率进一步降低成本。 智能小巨人科技 “烧钱换数据”构建“数据飞轮”: •“从某种程度上,我们现在不是缺大模型、缺技术,而是缺场景、缺数据,缺在一个场景下磨练大模型算法的能力”。 智能小巨人科技 各家公司降低大模型成本解决方案 智能小巨人科技 智能小巨人科技 公司算力层面模型层面 深度求索 2021年建设"萤火二号"深度学习训练平台,搭载了约1万张英伟达A100显卡 技术架构十分新颖,在MoE(混合专家模型)、RoPE(相对位置编码)和Attention(注意力机制)上有全新的创新 智能小巨人科技 智谱AI与多家算力服务商合作 自主研发GLM预训练架构,采用稀疏激活的MoE(专家混合)架构,还优化了模型以更好地适配多种高性能硬件平台 通过压缩算法等手段优化模型结构 智能小巨人科技 字节跳动搭建MegaScale生产系统,适用于万卡集群 智能小巨人科技 阿里巴巴 建设高性能AI集群“灵骏” 通过软硬件端到端的算力服务方案显著降低成本 在工程上从以前的单机推理演进到现在的分布式推理把不同负载的推理混合调度 改进了MOE框架,通过专家并行策略大幅降低算力消耗 百度AI异构算力管理平台、“一云多芯”提供模型路由能力,让小参数模型在特定场景中表现提升 腾讯 发布新一代HCC高性能计算集群自研星脉高性能计算网络 自研机器学习框架Angel和机器学习训练框架AngelPTM 智能小巨 智 智能小巨人科技 人科技 智能小巨人科技 智能小巨人科技 科大讯飞与华为合作打造的全国产算力平台“飞星一号”模型结构优化 人科技 智能小巨人科技 智能小巨 智能小巨人科技 智能小巨人科技 智 智能小巨人科技 智能小巨人科技 智能小巨人科技 智能小巨人科技 智能小巨人科技 •阿里的高性能AI集群“灵骏”是一种大规模高密度计算服务,全称为“PAI灵骏智算服务”,它提供了高性能AI训练和高性能计算所需的异构计算算力服务。 智能小巨 智 智能小巨人科技 腾讯高性能计算集群:大幅提升网络性能,近线性计算加速比 智能小巨人科技 智能小巨人科技 腾讯云发布了新一代HCC高性能计算集群: 智能小巨人科技 智能小巨人科技 在同等数据集下,可以将万亿参数大模型的训练时间缩短至4天; 人科技 智能小巨人科技 智能小巨人科技 智能小巨人科技 自研星脉高性能计算网络,具备3.2T通信带宽,通信性能提升10倍,成本比国外IB网络降低70%。 智能小巨 智 智能小巨人科技 智能小巨人科技 01 成本效率提升 智能小巨人科技 大规模的计算集群通过集中采购和优化资源分配,能显著降低单位算力成本。同时,规模化的运营有助于摊薄固定成本,使得每次计算任务的成本更低。 02 训练速度加快 智能小巨人科技 高性能集群提供了强大的并行计算能力,使得像万亿参数级别的大模型训练任务能够在更短的时间内完成。 智能小巨人科技 智能小巨人科技 03 数据处理能力与模型质量提升 规模化的计算能力对海量数据的处理能力提升,并允许运行多次实验,尝试更复杂的模型结构和算法,能够训练更大、更深的模型,捕捉更丰富的数据特征,提高预测准确率和泛化能力。 智能小巨人科技 04 算力稳定性与弹性增加 人科技 智能小巨人科技 大型集群提供了高度的计算弹性和容错能力,能够确保服务在高负载下的稳定运行,并且支持灵活的资源调配,可以根据不同业务需求快速调整算力分配,支持多样化的AI应用场景。 智能小巨 智 智能小巨人科技 智能小巨人科技