您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[未知机构]:人工智能大会交流–20230418 - 发现报告
当前位置:首页/会议纪要/报告详情/

人工智能大会交流–20230418

2023-04-20未知机构九***
人工智能大会交流–20230418

AIGC游戏专家交流游戏各环节应用: 大公司每年5款,中型公司1-2款,目前由于产品版号,目前没有像之前发的多。AIGC能结合市场数据表现判断是否能够成功以及是否要做,因为有些品类可能已经比较饱和或市场较大,但目前不会去做,因为现在立项较少。 主要作用包括: (1)文本生成:包含文生文(角色陪聊及辅助),目前游戏是写死的,但AIGC能够丰富对话场景,让NPC角色有灵魂、游动行走,即使没有玩家在里面,NPC也可以自己行走互动,能够有千人千面的帮助;剧情生成:部分剧情内容撰写,AIGC能帮忙给予更多可能性,每个游戏产品都有自己的世界观,AIGC可以用来做大世界和文本生成。 (2)角色和道具的生成:做角色的时候目前大部分由策划发起,美术不知道如何去绘画,画3D需要1-2周,试错成本非常高,有可能和预期偏差大。AIGC可以帮忙生成角色和动图,3D也可,但3D算力需求及成本较高,工作量大,因此大部分美术和原画会先生成100张2D图,选择其中几张风格去画,试错成本较低,提升工作效率。 (3)数值方面:每个角色在游戏公司数值体系有评分,可以让AIGC生成战斗数值、能力数值,团队把关数值体系是否在能力框架内,然后进行部分修正。 (4)角色周边:周边实物售卖激发更多灵感 (5)音效:过去调音师从demo开始,不断调整,目前AIGC快速生成多种风格的demo,加速创作过程。之前调音师在密闭环境缺乏灵感,AIGC可能可以生成十分钟demo做前奏、副歌、编曲,再编成完成bgm嵌入游戏;角色方面,二次元游戏中声优很重要,但是声优可能档期冲突,如果某个角色为人气角色且游戏中数值高、三观正,声优出问题公司会受影响很大 (6)场景生成:原神做三张图需要三个月,AIGC目前可以生成部分地图场景,但还需要调整才能应用,之后如果一个月生成一张图,就能快速提升产值。AIGC可以生成很多地图使得游戏玩家有更多时间探索,提升留存客户及客户游戏时长。 (7)宣发运营:素材制作中游戏本地化翻译(防止游戏delay,错过预约的资源位时间,不改变发行节奏)、素材制作中笔面当地文化雷区(付费方式在游戏中商业化设计不同、客户倾向付费的时间影响游戏投放时间、欧美更倾向宏大的世界观和场景,东亚地区更倾向于宅文化等等,如果踩雷就会非常影响投放成本)、优化买量平台投放分配(各个平台投放的资源分配,根据ROI做分配),AIGC可以帮忙告知在买到某个阈值的时候停止投放,保障整体ROI。 (8)社区运营:降低UGC内容创作难度,加大内容讨论度,自动发言AIbot带动社区活跃(百度贴吧中发帖怎么过,AIGC可以回复怎么过或去哪里看攻略,有互动氛围)。提升社群活跃和留存。 (9)商业化:帮助游戏内设置更合理的付费机制(付费机制需要合理的商业化平衡点,未来AIGC可以优化这一套数值体系,公司只需要做最终审核和拍板,敲定上下限),未来大模型和怪物反馈机制调优功能可能卖给其他游戏厂商使用。(模型自研,并不是所有公司都有能力做大模型,未来可以进行售卖,米哈游规划26年);怪物反馈机制:之前角色被攻击后角色树都是既定的,反馈机制是会有闪避或回避和反击,会更拟人化,使得用户体验提升。腾讯做的比较好是因为王者荣耀和吃鸡都很吃这个功能 降本增效量化分析: (1)文字:目前节约25%人力,终局节约70-80%人力、70%左右时间 (2)道具角色:目前节约20%人力,终局节约60-70%人力、50-70%时间 (3)场景生成(技术难度较高):目前10-20%时间,终局60%人力,50-70%时间 终局定义是盘点所有人力需要的工作和时间、决定什么可以被AI替代,以及AI所需要的时间,主要替代生成时间,而非验收 (4)宣发端:未来3-5年(保守)替换50%左右人力成本,提高20%左右ROI各大厂商布局: 目前做游戏AIGC的游戏公司只关注腾讯、网易、米哈游即可,做游戏是有创意的(羊了个羊没有技术壁垒但是有创意),但AIGC为纯技术领域的研发交流,考究的是团队人力成本、平均能力及技术能力。米哈游200多人团队平均年薪120w,和后面二线厂商差距较大,8亿投入AIGC,中小型厂商投入没有结果。 Netflix:专注AIGC视频生成,让更多KOL等做内容创作 迪士尼:专注IP角色自动生成;可以生成大电影进行售卖(游戏公司也有诉求,主线情节告知讲述的是什么故事) Minimax:首款产品Glow主打社交AI聊天,基本原理与chatgpt相似,更多聚焦情感服务。米哈游去年做过两次虚拟偶像直播(很多游戏背后是有终端控制的真人),米哈游捕捉、生成动作,AI生成声音,当时实时语音不够流畅,而minimax围绕文本、绘画、语音去做,可以补齐短板,所以做了投资 二线厂商包括完美、巨人、游族、灵犀、吉比特,都在做研发端AIGC; 三七主要做海外发行、投放,不以研发著称,卷研发对他来说可能没有意义,海外发行是top级别,在东南亚、欧美建立了独特的方法论,因此主要在国外发行强势领域做AIGC,拉开差距。 其他游戏相关AIGC技术: RCT、超参数相对领先,和大厂比较接近,但大厂模型自研且没商业化,所以会需要找大厂合作,需要用大厂模型部署在本地,把自己的数据和内容投喂生成适合自己的模型,但RCT、超参数希望中小型公司把数据给他们去生成完善(老板是之前王者荣耀总经理,目前做AIGC游戏研发);启元(莉莉丝等投资)、商汤(可能是和完美合作,做角色生成)、元象唯思(老板是之前腾讯AI学院院长,腾讯也投资了) AI解决方案专家交流 ChatGPT引爆全世界:进一步应用,偏创意场景,例如图片场景生成等。100w用户耗时五天,到1亿用户耗时两个月,科技界认为ChatGPT为AI的iPhone时刻,模型发展较大后形成量变到质变,推理、逻辑能力有较高增长。ChatGPT发布后国内互联网、科技大公司开始建立自己的AI大模型。 ChatGPT引领第四次产业革命:OpenAI产品能很好实现人际交流,影响范围涵盖普通大众日常工作及生活 工作过程:以用户的输入及之前的对话作为context,向后续写文本,每次输出1个token(1token≈0.75word)。有人分析国内数据质量较差,无法反馈较好的数据,数据重要性固然较高,但发展到今天,数据依然重要但算法和技术能力是更重要的。ChatGPT工作原理为例,一开始 有预训练阶段,此后经历有监督学习(人工生成高质量问题和答案)、评价模型(部分需要数据,不同人回答及打分)、强化学习(让模型学会大概如何评价,再有问题和答案时有网络进行自动评价)、上下文处理等。预训练阶段会输入很多数据,300billiontokens,预测下一个token然后迭代学习。主要能力浓缩在transformer网络结构(12-16层),富含了海量参数,包含矩阵乘法、指数运算等。 GPT-3效果:在数据量合适及算法能力能使数据运用的情况下越大的模型效果越好。GPT-3对比版本有很多,训练过程及数据量一样,效果对比方面175B的模型问答表现明显高于其他。 推理成本:AWS1000token/次,A100 推理成本=2*参数量FLOPS/token*token生产数量*$/flop(峰值性能下)/实际flop利用率 10000V100GPU耗时14.8天,inhouse训练一次74w美元(没考虑其他成本)自建$74w AWS$12M 搜索推荐领域收益: Bing已引入ChatGPT Google每秒请求量很大,每年需要35Bcost,当前不会启用底层软硬件需求: ChatGPT大概需要3640PFdays,1750亿参数,占用45TB数据量,datacenter1200w/次,此外需要多卡互联集群能力、通讯能力,智能革命最底层的支撑是大的算力系统,且算力为通用的,通用编程框架也很重要。 大模型还在持续迭代,每年参数的提升量在10-20倍。 在模型迭代情况下,目前英伟达领军发布的产品(V100-A100-H100)架构升级,H100引入了新的技术能力,此外,卡间互联能力也持续增长。 影视行业专家交流 目前AI在影视行业作为工具使用,纯靠AI生成的产品还在试验阶段,没有直接商用,但是具备前景。AI、ChatGPT在影视行业作用主要包括智能推荐、自动剪辑、智能字幕、艺术创作、语言学习及情感分析,总体来说目前chatgpt会回复比较general的事情。 目前AI艺术创作只能提供部分灵感和创意,广告行业关注洞察痛点,甲方提出很多要求时,AI工具能够解决一些困境,按照要求做部分模拟,贴合每天更新的要求。 智能推荐:ChatGPT可以分析观众的观影历史、兴趣爱好、评分等信息利用机器学习算法进行推荐,使观众更容易找到自己感兴趣的影视作品自动剪辑:ChatGPT可以通过分析不同的视频片段,自动生成剪染,债得制作人员可以更快速地完成剪辑工作,提高制作效率 智能字幕:ChatGPT可以通过语音识别技术将视频中的对话转换为文字然后使用自然语言处理技术生成高质量的字幕,提高观众的观形体验。 ·艺术创作:ChatGPT可以为编剧、导演等创作人员提供灵感和创意,通过分析大量的影视作品,生成新的剧本、角色、情节等元素,帮助创作者更好地发挥自己的想象力。 语言学习:ChatGPT能够自动翻译、解释和概括影视剧的内容,这对于学习和研究不同语言和文化的人来说是非常有用的。 情感分析:ChatGPT可以分析观众对于某部影视作品的情感反应,从而帮助制作人员更好地了解观众的需求和心理,为他们提供更好的体验。 Chiplet先进封装专家交流 目前AI能力越来越通用,模型变大,算力要求增长,底层要求模型框架及算力,周边需要配套更多CPU等算力单元。整体超大规模模型对半导体带来四大挑战: 1、算力需求持续翻倍,过去工艺制程进步难以继续,如何支撑算力增长 2、算力功耗成为核心问题,目前计算在全世界耗电量2-3% 3、存储访问功耗比重攀升,存储与连接对算力网络的进步带来了更大的挑战与瓶颈,功耗比重攀升的问题可以通过存算一体或chiplet解决 4、互联系统效率成为瓶颈 以同构和板卡级互联为特点的数据中心架构无法支撑未来持续陡峭的算力需求,Nvidia对所有的板卡级互联用了NVlink网络,对大模型单个集群训练,片间互联或用infiniband。但不是所有东西都能做并行计算,不同运用需要用不同方式调动计算卡,Nv把GraceCPU和A100放在一起做异构计算中枢,提升效率;Intel在去年推出3DGPGPUchiplet芯片,规模在原本5倍,3X+性能提升。做大芯片良率较低,算力持续上升成本上升,Intel在把不同的单元做拆分,做大芯片同时各个单元更小,功能灵活同时成本更低。 AMDGEN系列基于chiplet架构,在今年ces发布MI300,除了基于chiplet技术,还在数据中心芯片中实现异构,在同一个chip里集成了6颗gpu和3颗cpu,已经实现走向异构。 突破关键:基于chiplet的超大规模异构计算平台 Chiplet为异构计算的核心关键。之前更多与chiplet相关的概念为先进封装,但是chiplet实际上是架构开始的产业革命,软件层面需要统一编程模型和库堆栈,此外,异构计算单元芯粒化(cpu、gpu等,非计算单元也成为芯粒),需要连接系统(超高速大规模传输网络),物理上需要先进封装技术进行连接,die之间还需要dietodie接口,之前接口是不通用的,通用化在当时不成立,目前发生变化,去年3月成立UCIe,目前国内也在做不同的标准和产业认同,可以达到高速高性能、低功耗。高效调动die还需要高效连接网络。 什么是chiplet:基于原本soc架构进行拆分重组,把主要功能单元变成芯粒,通过先进封装和dietodie接口连接到chiplet互联网络中。 优势:持续扩大芯片面积,大幅提升性能;功能芯粒无需重复设计,降低研发成本;减小单颗芯粒面积,大幅提升良率,降本;海量芯粒组成各种芯片,加快上市周