您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[智能小巨人科技]:AI商业观察系列大模型,不止价格战 - 发现报告

AI商业观察系列大模型,不止价格战

AI智能总结
查看更多
AI商业观察系列大模型,不止价格战

大模型,不止价格战 智能小巨人科技出品 王铮Silvia 北京市朝阳区合生汇3楼 NO.1 大模型,不止价格战 •5月,中美“AI月”,国产大模型“价格战”开打•各方观点:“降价猫腻多”、“同质化竞争”、“行业洗牌”•把“大模型价格战”作为商业研究项目,结论却是:大模型,不止价格战! 1元能买到多少大模型token?Deepseekv2:100万! 来源:智能小巨人科技整理 “大模型价格战”开打!互联网大厂、AI独角兽入局 各方观点:“降价猫腻多”、“同质化竞争”、“行业洗牌” Ø我们借助各种AI搜索产品收集了几十篇关于“大模型价格战”的深度采访稿件,对AI业内人士的观点进行了梳理: Ø第一类视角:关于AI生态的上游技术要素。“大模型行业每年降低十倍推理成本是可以期待的”、“大厂烧钱是为了换数据,打造数据飞轮”等等。 Ø第二类视角:从用户价值的角度进行评价。“这反映了大模型行业内现有性能评测标准的缺乏,因为没有评价标准所以拼价格”;“国内大模型API使用起来层层套娃,先免费上车、但还是会跳转到其他收费项目”;“价格因素只是使用大模型的原因之一,还是更关注模型的质量、推理能力、参数和准确率”;“价格战对企业落地大模型是好事,但是仍然没有解决使用大模型到底带来哪些价值的问题”,“即使大模型落地通过预算环节,部署环节的数字化基础薄弱、工程化能力不强怎么解决”。 Ø第三类视角:对本次价格战的竞争性质做了点评。“大模型的性能遇到了瓶颈,只能同质化竞争,需要降价”、“大厂通过烧钱抢大模型市场份额”、“这次降价是B端的降价方法,云厂商的竞争升级了”等等。 Ø第四类视角:对AI产业生态演变的思考。“巨头在大模型赛道血拼是必然的,技术创业者首先要放弃幻想,如果压力太大,可以选择暂时先战术性‘躺平’一下”;“那些缺少模型差异化能力又没有商业化模式的大模型初创公司会被直接'卷死'”。 “大模型价格战”涉及的AI生态角色:大模型,不止价格战! 大模型上游:推理成本、数据生态 推理成本快速下降;不缺大模型和技术,缺场景缺数据。 大模型下游:企业、开发者 02AI应用爆发现实挑战众多,降价之外,预计更多AI应用扶持措施和生态系统构建计划在路上。 大模型”在位者”竞争 03在技术路线、产品服务、应用落地和市场定位等方面,领先的大模型厂商已经选择了各自的差异化路线图。 大模型“挑战者”机会 从大模型上游要素的供不应求到下游打通模型部署、API调用、应用落地的全链路中,还有很多产业环节上的空白;蓝海机遇大于红海竞争。 NO.2 技术性降本、高性能计算集群与数据飞轮 •大模型推理成本降了多少?“价格战”公司技术性降本能力如何?•深度求索和智谱AI降价底气:大模型架构和算法策略创新•“在位者”公司:投入算力管理平台、建设高性能计算集群•高性能计算集群的规模效应•“烧钱换数据”,降价意在构建“数据飞轮”•一年时间,推理成本降低10-100倍,领先大模型厂商边际成本下降幅度更大 大模型独角兽通过技术架构创新大幅降低成本: •DeepSeekv2在MoE、RoPE和Attention上有全新的创新;•智谱AI自主研发GLM预训练架构,采用稀疏激活的MoE架构,并优化模型适配多种高性能硬件平台。 大模型上游 科技巨头与老牌厂商的多重大模型降本策略: •在模型层面进行技术性降本;•投入算力管理平台、建设高性能计算集群等基础设施来大幅提升算力利用效率。 ü一年的时间里,大模型的推理成本降低了10-100倍,奠定降价基础 重金投入的AI基础设施,亟需规模效应: ü重金投入AI基础设施,又亟缺场景和数据的失衡状态下,必须多管齐下,降低使用门槛,增加用户基数 •阿里和腾讯都专门建设了高性能的计算集群;•大规模集群的运维成本分摊到每个计算任务上更为经济;•大规模集群支持灵活的资源分配和调度,高利用率进一步降低成本。 “烧钱换数据”构建“数据飞轮”: •“从某种程度上,我们现在不是缺大模型、缺技术,而是缺场景、缺数据,缺在一个场景下磨练大模型算法的能力”。 大模型降本方案:技术架构、算法策略、算力管理多管齐下 阿里高性能集群“灵骏”,高性能AI训练和计算的异构算力管理 •阿里的高性能AI集群“灵骏”是一种大规模高密度计算服务,全称为“PAI灵骏智算服务”,它提供了高性能AI训练和高性能计算所需的异构计算算力服务。 腾讯高性能计算集群:大幅提升网络性能,近线性计算加速比 腾讯云发布了新一代HCC高性能计算集群: 在同等数据集下,可以将万亿参数大模型的训练时间缩短至4天; 自研星脉高性能计算网络,具备3.2T通信带宽,通信性能提升10倍,成本比国外IB网络降低70%。 大规模计算集群产生显著的规模效应,高利用率将降本增效 成本效率提升 01 大规模的计算集群通过集中采购和优化资源分配,能显著降低单位算力成本。同时,规模化的运营有助于摊薄固定成本,使得每次计算任务的成本更低。 训练速度加快 高性能集群提供了强大的并行计算能力,使得像万亿参数级别的大模型训练任务能够在更短的时间内完成。 数据处理能力与模型质量提升 03 规模化的计算能力对海量数据的处理能力提升,并允许运行多次实验,尝试更复杂的模型结构和算法,能够训练更大、更深的模型,捕捉更丰富的数据特征,提高预测准确率和泛化能力。 算力稳定性与弹性增加 大型集群提供了高度的计算弹性和容错能力,能够确保服务在高负载下的稳定运行,并且支持灵活的资源调配,可以根据不同业务需求快速调整算力分配,支持多样化的AI应用场景。 “大模型价格战”意在“烧钱换数据” 澜码科技创始人周健 1“竞相降价的现象,不能说是一个噱头,厂商互相之间在竞争数据,他们希望能够有更多的开发者基于各自的大模型去开发应用。” 浪潮信息董事长彭震 2“从某种程度上,我们现在不是缺大模型、缺技术,而是缺场景、缺数据,缺在一个场景下磨练大模型算法的能力。” 大模型降价竞争优质数据构建“数据飞轮” 降低门槛增加用户基数 促进应用开发与多样化 对于许多预算有限的中小企业和独立开发者而言,成本是决定是否采用先进AI技术的关键因素之一。 随着更多开发者使用大模型,会出现更多AI应用场景和产品,触及更广泛的消费者群体,增加用户交互,收集更多样化的数据。 数据回流与模型迭代 大模型成本与价格降低 用户交互数据如果能够反馈给模型提供商,可以用于模型的持续训练和优化,进一步提升模型的性能和泛用性。 一年的时间里,大模型的推理成本降低了10-100倍;拥有技术与资金优势的玩家降低大模型价格。 NO.3 开发者与企业用户:“价格战”?还不够! •大幅降价的是入门级模型产品,普惠场景:试错型项目的测试与验证 •开发者视角:直白比价是权宜之计 •企业级用户视角:仍然需要多种大模型服务支持 •更多AI应用扶持措施和生态系统构建计划在路上 降价的普惠场景是试错型项目的测试与验证 •几家公司的降价原因:主要目的是“普惠”、“驱动产品创新验证”、“降低试错成本”等等;大幅降价的主要是入门级模型产品,普惠的场景是试错型项目的测试与验证。 大模型下游 缺乏大模型性能评测标准,直白比价成为权宜之计 •降价行为仍然反映了大模型性能评测标准的缺乏,既然没有统一的标准,通过直白的比拼价格可以让部分开发者更容易理解和选择。 ü企业落地AI应用的挑战众多;已经跨过AI落地门槛的企业迎来调用量暴增,使用门槛之外的企业需要借助更多帮扶措施才能享受低价 直接受益降价的企业:已跨过使用门槛,有广泛应用场景 •企业落地AI应用的现实挑战众多;已经跨过AI落地门槛的企业迎来调用量暴增,使用门槛之外的企业需要借助更多帮扶措施才能享受低价。 ü可以预见,更多AI应用扶持措施和生态系统构建计划在路上 可以预见,更多AI应用扶持措施和生态系统构建计划在路上 •企业级用户落地AI应用仍然需要多种战略合作的服务支持;•亟需加速市场爆发的大模型公司,一方面还会推出更多扶持AI应用生态的措施,另一方面会积极寻求合作伙伴构建生态系统,提供端到端的解决方案,加速AI应用的爆发。 为何降价?“普惠”、“驱动产品创新验证”、“降低试错成本” “大模型价格战”参赛公司谈为何降价 火山引擎谭待: 智谱AI: 为了让大模型更广泛地应用起来,团队认为需要降低开发者的试错成本,从而降低大模型创新的风险。 降价是为了让更多人都能用到智谱AI的入门级模型产品。 百度智能云沈抖:现在成本更低了,大家创新的胆子可以 更大一些、步子可以更快一些,把相关的场景都试一遍,快速验证;跑成功了,就快速复制。 科大讯飞:焕新的价格体系将帮助开发者降低调用 腾讯云: 成本,驱动产品创新验证,解决真实世界的刚需。 重视技术积累与客户体验,会持续提供有竞争力的产品和服务。 大模型六种商业化路径中,API降价有利于中小企业和开发者 API价格大幅下降 03 ToC产品化 与现有产品集成 API开放平台 将大模型封装为API,通过开放平台提供给开发者和公司使用。用户按调用量或使用时长付费,是轻量级的接入方式,适用于中小企业和开发者。 与传统应用/软件、SaaS服务或硬件产品集成,提升产品智能化水平,增加附加值;如将AI功能嵌入客服系统、办公软件、智能家居设备等。 直接面向消费者推出基于大模型的产品,如ChatGPT;免费试用吸引用户后,推出付费订阅服务,如ChatGPTPlus,实现大规模用户的商业化变现。 06 04 定制化解决方案05 软硬件一体化 私有化部署 为企业客户提供定制化的大模型应用开发,解决特定行业问题,如金融风控、医疗诊断、智能制造等,按项目或效果收费。 包含云端私有化部署和本地私有化部署两种,确保企业在访问大模型的时候对数据有控制权,适用于对数据安全性有要求的企业。 结合大模型与国产化硬件,打包成一站式解决方案进行销售和部署,满足特定行业或政府对于数据安全和自主可控的要求。 来源:智能小巨人科技整理 缺乏大模型性能评测标准,直白比价成为权宜之计 •对于生成式AI开发者而言,在研发中最期待的助力是应用开发的工具链支持、实践案例分享、相关技术课程、技术与业务结合的专业咨询等;其中生成式AI工具链中难度大工具少的环节又以模型评估、模型调优两个阶段最为突出!对于生成式AI开发者而言,对于资金支持的需求并非优先级最高的选项。•有资深开发者表示,降价行为仍然反映了大模型行业内现有性能评测标准的缺乏,既然没有统一的标准,通过直白的比拼价格可 以让用户更容易理解和选择。 企业级用户需求:测试与概念验证是投资生成式AI的前提 企业级用户部署生成式AI旅程含规划、测试、投入环节;测试与概念验证是企业投资生成式AI的前提,降低试错项目的门槛能够拉动企业级AI部署。 24%的企业表示已经投资生成式AI,并且有相应的预算计划。这些预算可能来自2023年已有的规划,也有些是针对生成式AI新增的预算。 企业落地生成式AI应用的现实挑战众多,价格并非主因 来源:IDC,智能小巨人科技整理 直接受益降价的企业:已跨过AI落地门槛,有广泛应用的场景 阿里云:降价后客户案例 有头部招聘企业将大模型从简历筛查推广到更多创新业务场景;一周内,该企业的大模型调用量翻了100倍,但数百万调用量的成本不到200元,成本大幅下降。 调用成本低于200元 调用量翻100倍 企业落地AI应用仍需要多种战略合作服务支持 可以预见,亟需加速市场爆发的大模型公司,一方面还会推出更多扶持AI应用生态的措施,另一方面会积极寻求合作伙伴构建生态系统,提供端到端的解决方案,加速AI应用的爆发。 案例:科大讯飞扶持百万API开发者,推出开发者专属服务体系 讯飞星火API能力正式免费开放,Lite版本推出永久免费,Pro与Max版本大幅降价,还面向大模型开发者推出专属服务体系!