热门搜索：

算力租赁专家–20230924

2023-09-25-未知机构�***

嘉宾ÿ算力租赁_家时间ÿ20239o24å 心观点ÿ 11算力租赁在未来一内需求会持续增à，ÿ格将会稳P升2 21算力租赁未来在中小企业1科研院所1政府的智慧城市项目p着很大`持续的需求2 31[作类和游o未来的算力需求将会快速增长2 一1_家Ï绍基本情况从使用方的角度Ï绍算力租赁，公ø从2019开始做大模型，直到20233o份以前，通过算力租赁方式都比较少2企业自ý去购买一Ā服á器，然后用到报废的方式比较划算2算力租赁ÿ格方面在Î5o份开始涨ÿ，7o单节点一 ÿ格相比于5o又P升30%þ右2并`在CPU以及à种固态比较高等级SSDP都降O规格，包括节点A联速度比5oßO了一点27oÿ格在叠à各种`惠后是7万þ右2 ÿ格提升很快的原因是暑期以后，更多人关注到偏Þ用阶段的算力需求，5o以前更多关注的是训练需求2从部委数据显示，全世界文生Ā以及文生文1包括AI剪辑的à种产品，推理阶段算力需求是训练阶段2-7倍2所以从暑期开始，算力企业一直O停地增à算力设备，但整体ß是短缺2 算力需求要来源于O方面ÿ11BAT大A联网企业以及3601♘仑万维à些大模型训练端企业和各个垂类场景Þ用端的企业2à些通常会选择自建算力或者让A联网企业给他们做自建算力Ā21[业公ø和科研院所2à些机构做大模型O会做pchagpt的规模，但整体P也ó少需要5000[以P算力需求Ā31政府智慧城市大模型W，包括城市智能交通1智慧城市等等2从2020开始，包括X京以及Þ庆1武汉1江苏无锡，都开始将大模型P智慧城市结合2目前，政府偏向用公共算力去做à部V2 目前，算力租赁要需求来源于第二和第O部V2缺口量方面，ÿ内Ā在p大概100个þ右大模型，每个模型大概2000-3000[算力，按照推理是训练的2-7倍倍率«算，整个ÿ内明总需求量大概是200万张þ右a100的量2目前全ÿ算力à起来连一半都O到2à是当前AIÞ用落地阶段短中期的需求量2但是从q所在机构2019就在做大模型的角度来看，目前行业内þ经落地了p70多款Þ用，要是媒体1ý业教育和交通等领域2参考最à微软大模型集p的操作系统1英伟达ð推出的一些设施1特ï拉自动驾驶等，ÿ外整体Þ用端往后面会ÿ发出更多的需求2q认游oà块ÿ能会ÿ发出巨大的需求，因随着大模型文生文以及文生Ā的能力逐渐p熟，Î比较前沿的技术都聚焦于在AI生p3D以及AI生p视频à两方面，都是很容易去跟游o去做结合2从à两个方面的技术p熟度的角度来看，Ā在从英伟达1Google推出的一些技术，à部V技术壁垒在最à两个oþ经攻破2所以需求很大，大模型对游o的改善会是非常巨大的2ÿ内目前做游o的厂商O像ÿ外那么多，但à部V是ÿ以跟算力租赁结合2 把à些场景都算P，算力租赁ÿ格虽然9o份的ÿ格ß是P7o份的一，但是在硬盘P以及在节点之间A联P，速度会更O一些2算力租赁企业会尝试以更O的p本在向租借方提供服á2因此后续的ÿ格，ÿ能需要跟Þ用端去做结合2到了ßÿ能会p几家在中文领域超过GPT3.5，叠àà个情况来算，整个ÿ格在那个阶段会p一定的P升趋势2长期来看，未来ÿ能ß要参考ÿ外技术的进展，目前ÿ外在往多模态方向发展，一æ多模态p了爆发之后，算力需求将会是爆发式的增长2据公开的研究，当模型的参数量增大10倍，整体的算力需求将扩大100倍2à是当前技术无法突破的一个点2因此，q判断算力租赁ÿ格ß是会P涨2对于很多算力租赁企业来讲，能否p资金买到t，以及买到t多久能到货是很关键的2很多企业初的目标是建1万[算力，但是到目前止到货的算力甚óO到1000[，目前行业内的Ā状就是拿t速度很慢2同时，对算力租赁企业来说网络à块的要求ß是比较高的2因对于1,500ÿ参数以P的模型决定训练效率以及推理效果à部V，O只是单纯的单t算力，ß包括HBMà种高端显`的量以及t间 A联的速度2Ā在ÿ内Q一个¬单去拿到à高配置的t，一般得半，因英伟达要ÿ外供货，对于ÿ内来说供货量没p那么大2 此外，对于算力租赁企业能否获得长足的增长，常ÿ能一些性的需求，包括帮政府做代ß营，把à部V整体`同起来也很关键2因算力O单是来自大模型的需求，各个地方的测算中心也p很多在用ÿ外的算力«算中心2包括城市大脑的建设，每个城市的|块链节点，都是需要拿到Ā去«算的，如果能把à块也做好，也是一块很大的增长点2 二1交流P问答ÿ节 QÿV析一Q目前整个算力租赁市场的大概的格局是Ā么？从ÎQ半以来，拿t的节奏会O会比以前要稍微快一点？ Aÿ超过一半的企业的没p达到初«划的算力2一个方面本身t的到货量没p那么多，另一个方面企业coverOPà的p本21000[的算力，经过测算ÿ能需要2~3个ÿ才能cover得P2从à个角度V析，很多企业的目标建1万[算力，资金是O够的2整体来说Î的到货量跟大_认的ß是p一定的差距2 从明来说，供货方面ÿ能会好一点，但整体明O会改善z多，再往后一到货情况会改善很多，q认大概是à 的趋势2 Qÿ在整个算力市场，ÿ内_的生态会O会说在智慧城市à一块p更多的参P，然后打破原p的竞争格局，从科研机构的角度来看，怎么看待à个问题？ Aÿ11_是按金_塔形式在发展大模型，就是à些行业在提供O只是算力本身，ß包括网络`储1一些AI框架1训练过程中的子`W，一整套从ß层硬þ到软þAI框架的服á2_是从à个角度W入行业，并O说单纯的从大模型的角度，大模型角度只是一个层面，_Ā在在大模型很多tob的领域þ经p¬单了2_在大模型à块的`势来自于它之前对各个行业场景的锤炼，以及对相关数据的整合，它整个一体W的产品形态以及对于很多à种小本场景的模型能力比w他之前没p做过场景的大模型的企业更p`势的，就是从大模型赋能行业端à是_的`势2 21整体的一体W能力，O光需要一个模型，而是整体的，企业用起来整体会更方便，包括整个模型的效率以及性能à块2整体_大模型的提升效率能达到一个20%以P，à是公开的数据2它整体像单t算力ßÿ以，跟英伟达a100ÿ能差距没p特别大，整体60%þ右2但_在做集p的时候，一æà个集群整体的使用，q们的算力集群的使用效率ÿ能经常会O到50%，à是一个常态，à是它跟英伟达做对比的缺点2短期业内Oz关注à个缺点，大家短期更关注把整个ß能做起来2但是到了中长期，追求极ô性ÿ比的时候，如果_在à块的一个点ß没p做起来，那么大家ÿ能会考虑像ÿ内w他的算力生态，包括甚óp的会O会转型英伟达2 Qÿ租赁ÿ格未来几的一个预测中枢大概是在Ā么的水，明和后大概V别会达到一个Ā么的状态？ Aÿ供给端Þ该态势在短期O会pz大ØW，但需求端会p一个比较大的ØW2ÿ格明ØWß是偏阶段性稳P 升2到后，整个ÿ格ÿ能会微微的Q降，然后会阶段性维持一些时间2q认ÿ内在推理端是p自研能力的，在后 à块ÿ能会p一定的产能2因此ÿ格会微微Q降2 Qÿ需求是来自于哪些方面，训练ß是推理？ Aÿ当前阶段偏向训练，推理ÿ内处于比较早期2 Qÿ租赁Ā在能选的只pa800和h800？ AÿĀ在租赁方面409013090也能租到，但a800是要的2 Qÿ拿a800的t来做推理，p没p性ÿ比？ Aÿ中高端显t在视频场景Q，它的性ÿ比1效率是更高的2 Qÿ到了2025模型训练都p一定的p果后，是O是就O需要那么多算力了？ Aÿ训练的算力需求VO方面211整个大模型都往偏场景端去拓展，ð的场景是需要ð的数据Þð训练，带来数据端的一个增长，训练的需求2 21模型参数量的增长，在transformerà套架构Q，更多来自于模态的数量增长带来模型参数量增长的一个ØW2多模态在接Q来半一定在大模型Ý面是一个最Þ要的增长点，在à个层面会带来算力的增长231在训练阶段算力需求来自于经常需要去迭代大模型，一般一个o需要迭代一次2 QÿAI算力租赁是因Ā在短期缺t带来的暂时性Ā象，ß是从长期来看à个行业确实p自ý生`的空间？ Aÿ对中小企业1初[企业1科研机构à种偏向轻资产的模式，转租赁的方式会是一个好选择2 Qÿÿ内算力比如说_它à边对英伟达à边指代性怎么？比如训练用英伟达的，然后推理用_的？ Aÿ全部用英伟达去训练，然后基于_去推理是没p问题的，在技术Pÿ以实Ā的2 Qÿ明ÿ能英伟达的t对q们来说ß是非常紧张，ÿ内的t是O是像_à种就p机会？ Aÿ_当前阶段，要机会ß是来自于各个地方的政府项目和地方的金融1能源1教育等等à些领域的tob场景，但是大部VA联网企业ß并没p全面的去用他们的算力去提供服á2A联网企业更à在乎整个极ô的效率à一块2 Qÿ_的芯w据说对扩大模型兼容性比较差，目前p没p改善？ Aÿ稳定性方面_ßO错，调度效率à方面跟英伟达ßp一定的距离2 Qÿ像交通行业，接Q来整体推理需求P来比较快的à个时间节点大概是在Ā么时候？ Aÿ交通在城市大脑1自动驾驶1铁轨领域后续会比较快速态势的增长，因没p大规模场景，推理阶段的算力需求大概是训练的1.5～2倍的量2 Qÿ接Q来哪个方向P的推理算力需求会快速增长？ Aÿ目前教育1法律和Þ公需求较大，未来偏[作1剪辑1游o会快速增长2 Qÿ明英伟达给ÿ内供的量，s他整体的出货量大概是多大的比例，然后ß厂商的s比又p多少呢？ Aÿÿ内à边s比O是很高，Þ该O到30%2ß厂商s比O是特别高，大概20%130%以内2 Qÿ从产业的情况来看，p没pð的路线能够挑战Ā在transfomrer架构的，因à种对算力1对参数的感觉p点z简单粗暴了2 Aÿtransformer本身是大力出奇Ā2当它ß层的架构，确实是x备统一的表Ā力，后面增à3D模态1ß动模态，会发Ātransformer都能做出来，à是它的`点2然后确实它对于算力的í耗à块，整个的复杂度是比较高的2所以Ā在p一些ð的项目，把transformer完全去改进Þ写的，Î8o份香港à边跟ÿ外做出来一个统一的表Ā架构，当然à个是停留在论文阶段，并没p在ý业场景去用2à些ð的`W的模型，会在半一内会被采纳2transformer它的 `点很明显，缺点也很明显2 Qÿ_的算力租赁市场接×度高吗？电耗p本差距多少？ Aÿ它的p本是要比英伟达à边O百V之20~30þ右2当前阶段_对于它生态Ý面的à些企业大概p50多家，它的服á力度ß是比较足的，比英伟达会O少2企业更多考虑的是_给他带来的整个生态P的，包括¬单，包括场景P的拓展迁移2 QÿĀ么推理的需求能在_服á器P使用，如何做适配的？ AÿZ开始会î及到花一点时间和人力去做适配，但是后续模型更改，包括基于à个x本去迭代，_à边是没pz大问题的2因_在代码性P1易读性P1Þ用性P基本一ô2 Qÿ_服á器使用的是哪些型÷？ Aÿ910系列2它的CPU端目前既p基于鲲鹏的，也p基于光的2基于光和基于鲲鹏的比例，大概是3:72 Qÿÿ内自研发，而O是在开源大模型P微调的企业要p哪些？ Aÿ基本Ā在能看到榜单P的都是自研发2p些早期ÿ能用开源x本去做了一个微调，然后验证在à个场景中是否能用2然后会将整个开源完全去拆开了，Þð去搭自ý的一个，据自ý场景去搭自ý的一个架构2à个基本Pÿ以认是一个偏自研发的2 Qÿÿ外用大模型做游o改Ø格局？除了大模型NPC，大模型生p界面外，ßp没pð的玩法出Ā？ AÿĀ在ÿ外沉式的游o，包括Ā伴式的à种虚拟人型的游o，ßp一些冒ÿ游o，它大模型叠à画Ā的项目，往常ÿ能需要一到几个o做p，Ā在大概Oyÿ以把一个游o去做完2当前阶段3Dà块技术壁垒þ经解决了，但是离Þ用ÿ能ßp小几个o的时间，à块出来之后，整个大模型ÿ以画3D人物了，背景没p问题，又ÿ以通过大模型给它设置策略2Ā在像中小型的游o企业[ð能力又足够，à个思路又解决了2游o行业ÿ能会î及到一些颠覆的情况2

点击免费查看完整报告