行业研究公司研究宏观策略财报招股书会议纪要海南封关低空经济 DeepSeek AIGC 大模型

乐元素&Intel案例白皮书

2024-03-25腾讯「***

AI智能总结

核心观点与关键数据

乐元素科技（北京）股份有限公司（简称：乐元素）在其移动网络游戏《开心消消乐》中引入AI技术，以提升关卡设计质量与效率，但面临AI算力挑战。为解决性能、成本和灵活性问题，乐元素采用基于第五代英特尔®至强®可扩展处理器的新一代腾讯云实例S8，并利用英特尔®高级矩阵扩展（英特尔® AMX）、英特尔® oneAPI和英特尔®深度神经网络库（英特尔® oneDNN）等技术，显著提升AI推理性能。

挑战与解决方案

挑战：

性能挑战：用户增长和内容扩充导致服务器需处理大量数据和请求，需要更高算力支持。
成本挑战：游戏运营成本随用户和内容增加，需降低模型推理的单位成本。
灵活性挑战：需灵活适应不同模型推理需求，支持基础设施和工作负载切换。

解决方案：

硬件升级：采用第五代英特尔®至强®可扩展处理器，提供更高算力和能效，内存采用DDR5，网络优化。
软件优化：利用英特尔® AMX加速AI推理，英特尔® oneDNN简化深度学习编程，提升性能和开发效率。

性能验证

自研打关模型：

相比第三代英特尔®至强®可扩展处理器，第五代处理器在相同数据精度下推理性能提升1.37倍，启用英特尔® AMX后提升3.44倍。

ResNet-50模型（新春扫龙字活动）：

相比第三代英特尔®至强®可扩展处理器，第五代处理器在相同数据精度下推理性能提升1.19倍，启用英特尔® AMX后提升5.19倍。

收益

提升游戏开发与运营效率：满足AI算力需求，支持自动打关等模型推理。
降低成本：无需昂贵专用AI服务器，按需扩展，提高投资回报率。
灵活应对其他AI应用：支持游戏开发与运营其他环节的AI技术需求。

展望

AI技术已成为游戏产业发展趋势，生成式AI等应用已广泛应用。构建AI算力平台成为游戏公司竞争力关键。乐元素实践证明，基于第五代英特尔®至强®可扩展处理器的腾讯云实例S8可满足AI推理算力需求，兼具经济性和灵活性，是游戏企业拓展AI应用的理想选择。未来，英特尔将与腾讯云和乐元素深化合作，加速AI在游戏开发与运营中的应用，提升玩家体验。

英特尔®至强®可扩展处理器英特尔®高级矩阵扩展（英特尔® AMX）基于第五代英特尔®至强®可扩展处理器的新一代腾讯云服务器加速乐元素游戏AI推理 “伴随着人工智能的快速发展，越来越多的玩家希望能体验到更创新的游戏体验。腾讯云依托腾讯内部多个人工智能实验室，将AI与云深度融合，通过公有云的方式开放给行业，让客户实现高效接入、灵活使用，推动业务的智能化再升级。” “在游戏开发与运营中采用AI已经成为我们的一项关键步骤，但这也带来了显著的算力需求。基于第五代英特尔®至强®可扩展处理器的新一代腾讯云服务器在性能方面展现了明显的优势，特别是在游戏模型推理性能上的表现，让我们感到非常满意。我们计划未来在更多线上环境中部署和使用这款服务器，同时也期待能够与英特尔共同探索更多的技术创新，以便为各种使用场景带来更强的性能提升体验。” —许华彬腾讯云副总裁 “AI正在为游戏产业带来巨大的革新，并已经在众多流行游戏作品中得到成功应用。要想在这场技术浪潮中获得先机，游戏企业需要更加重视AI战略的执行，并在AI算力基础设施上投入更多的精力。英特尔为游戏企业提供了涵盖多种软硬件的AI全栈解决方案，能够帮助游戏企业解决AI应用的算力困扰，加速拥抱AI创新。” —陈葆立英特尔数据中心与人工智能集团副总裁中国区总经理概述针对关卡上线流程长、难度不易预测、玩家离线数据真假难辨、新玩法兼容旧关卡等问题，移动网络游戏研发及运营商：乐元素科技（北京）股份有限公司（以下简称：乐元素）创新地在关卡设计等流程中引入了人工智能(AI)技术，从而加快关卡设计质量与效率。但同时，AI技术的应用也带来了AI算力挑战，如何构建高性能、低成本、高灵活性的AI算力平台成为乐元素需要考虑的重要问题。 —钱晓东乐元素开心消消乐制作人为进一步给用户提供更流畅、优质的游戏体验，乐元素引入了基于第五代英特尔®至强®可扩展处理器的新一代腾讯云实例S8，比上一代服务器的整体性能提升了23%1。除此之外，乐元素与英特尔紧密合作，采用处理器内置的英特尔®高级矩阵扩展（英特尔® AMX）等高级硬件能力，以及英特尔® oneAPI和英特尔®深度神经网络库（英特尔® oneDNN）等软件技术，提升AI推理等方面的性能表现，并在自研打关模型/ ResNet-50等模型推理中得到成功验证。大关卡类型、60余种障碍设计、8000多个精心设计的关卡，关卡制作是这款游戏运营工作的主要内容之一。在《开心消消乐》中，用户每日都会进行游戏关卡挑战，而关卡的质量对于游戏的收入和用户留存起着至关重要的作用。乐元素的游戏团队不断推出新关卡和玩法，并持续调整线上关卡的体验和难度，以提供持续新鲜的游戏体验。其中AI在关卡制作和优化中扮演了重要角色。对于新增和调整的关卡，AI通过大量自动打关任务，确保关卡配置无错误，难度符合预期，并快速验证关卡。对于新开发的玩法，AI也通过大量自动打关任务，确保逻辑无错误。每天平均运行超过1亿次打关任务，推理次数更是超过30亿次2。挑战：AI模型推理需要强大的算力作为支撑近年来，乐元素在旗下热门游戏中，强化了AI技术的应用。以《开心消消乐》为例，该游戏是一款消除类休闲游戏，画面精美、上手简单、轻松有趣之余，又充满惊喜与挑战。游戏拥有9 但同时，由于用户群体不断增长，以及游戏内容持续更新，乐元素AI模型推理面临着性能、成本和灵活性等方面的挑战。性能挑战成本挑战灵活性挑战随着游戏用户数量的增加和游戏内容的扩充，服务器需要处理大量的游戏数据和用户请求。这意味着游戏服务器需要具备足够的算力来支持游戏的顺畅运行。要提升模型推理性能，一方面可以采用具备更高算力的硬件基础设施，另一方面也可以利用将模型转化为低精度格式、采用加速指令集等方式，以更好地释放算力。游戏运营成本随着用户数量和游戏内容的增加而增加，特别是当部署专用的模型服务器时。乐元素希望在满足模型推理的性能需求时，能够尽可能地降低模型推理的单位成本，从而寻找更适合推理的算力选项。游戏服务器需要具备足够的灵活性，以适应不断变化的游戏内容和用户需求。特别是在处理不同的模型推理需求时，需要具备灵活的基础设施和工作负载切换支持，以满足游戏运营的需求。解决方案：基于第五代英特尔®至强®可扩展处理器的腾讯云实例S8 载。第五代英特尔®至强®可扩展处理器拥有更可靠的性能，更出色的能效。它在运行各种工作负载时均可实现显著的每瓦性能增益，在AI、数据中心、网络和科学计算的性能和总体拥有成本(TCO)方面亦有更出色的表现。相较上一代产品，第五代英特尔®至强®可扩展处理器可在相同功耗范围内提供更高的算力和更快的内存。此外，它与上一代产品的软件和平台兼容，因此部署新系统时可大大减少测试和验证工作。新一代腾讯云实例S8基于全新优化虚拟化平台，提供了平衡、稳定的计算、内存和网络资源，是众多应用程序的卓越选择。其中，标准型实例采用第五代英特尔®至强®可扩展处理器，内存采用最新DDR5，默认网络优化，最高内网收发能力达4500万pps，最高内网带宽可支持120Gbps3。腾讯云实例S8搭载的第五代英特尔®至强®可扩展处理器凭借内置加速器实现单核性能提升，能够轻松应对要求严苛的工作负第五代英特尔®至强®可扩展处理器每个内核都具备AI加速功能，无需添加独立加速器，就可处理要求严苛的AI工作负载，包括对参数量多达200亿的模型进行推理和调优4。为了进一步提升新一代腾讯云实例S8在模型推理等负载中的性能表现，乐元素与英特尔深度利用英特尔® AMX以及英特尔®oneAPI、英特尔® oneDNN来进行性能优化。英特尔® AMX作为英特尔®至强®可扩展处理器内置的加速器，可加速基于CPU的深度学习推理，避免了使用独立加速器带来的成本和复杂性。英特尔® AMX在迁移学习和再训练方面同样出色，用户无需额外添置硬件即可使模型保持最新状态。行比对，这其中的距离计算会产生大量的矩阵乘法，而英特尔®AMX能够针对这一场景实现有效加速。英特尔® AMX引入了一种用于矩阵处理的新框架（包括了两个新的组件，一个二维寄存器文件，其中包含称为“tile”的寄存器，以及一组能在这些tile上操作的加速器），从而能高效地处理各类AI任务所需的大量矩阵乘法运算，提升其在训练和推理时的工作效能。例如在向量检索的过程中，如存在n个batch任务，进行相似度计算时就需要对n个输入向量x和n个数据库中向量y进通过采用英特尔® AMX技术，乐元素能够提升AI性能，满足包括以下场景在内的众多场景的需求：升级的三消对战游戏体验个性化体验 AI可以分析玩家的行为和偏好，为每个玩家提供个性化的游戏体验。英特尔® AMX技术可以助力快速处理玩家数据，以实现快速的游戏元素调整，例如游戏难度、小动物掉落等。 AI控制的多人游戏系统可以创造更加真实和吸引人的在线互动，例如AI控制的对手棋盘实现PVP的游戏体验。英特尔® AMX可以快速处理大量数据，以提供更加平滑和快速的在线游戏体验。英特尔® oneDNN则提供了深度学习构建块的高度优化实现。借助这一开源、跨平台的库，深度学习应用程序和框架开发人员可以对CPU、GPU或两者使用相同的API，从而抽象出指令集和其他复杂的性能优化。在模型性能优化中，通过使用英特尔®oneDNN，操作者只需要调用包含一些后期操作的MatMul基元并传递几个参数，oneDNN即可完成其余的工作，例如配置块寄存器文件、从内存加载数据、使用后期操作执行矩阵乘法计算、将结果存储回内存中，最后释放块寄存器文件。通过使用英特尔®oneDNN，编程人员可大大降低编程的难度。通过上述优化措施，腾讯云能够在游戏业务中使用AI加快关卡学习及迭代速度等场景里提供满足客户性能和服务质量(QoS)需求的解决方案。性能验证：实现显著的代际性能提升为了验证在典型的模型推理负载中，基于第五代英特尔®至强®可扩展处理器的新一代腾讯云服务器带来的代际性能提升进行了性能测试。自研打关模型乐元素自研AI打关模型用于自动打关任务，以确保关卡配置无错误，难度符合预期，并快速验证关卡。推理性能测试数据如图3所示，对比腾讯云与英特尔联合定制优化的第三代英特尔®至强®可扩展处理器，在相同的数据精度下，第五代英特尔®至强®可扩展处理器的代际性能提升1.37倍，而在启用了英特尔® AMX将模型从FP32转化为BF16后，第五代英特尔®至强®可扩展处理器的推理性能提升3.44倍10。消消乐新春扫龙字活动乐元素在《开心消消乐》中引入了新春扫龙字活动，在玩家上传扫描的图片后，乐元素会通过ResNet-50模型进行图片识别，并返回识别的结果。ResNet (Residual Network)是一种深度学习模型架构，被广泛应用于处理视觉和文本数据的深度学习问题中。ResNet-50作为ResNet的一个变种，在大规模数据集上表现出色，并且在图像分类、目标检测和语义分割等视觉任务中取得了显著的性能。作为一个中等规模的深度学习模型，ResNet-50在计算资源有限的情况下，仍能够提供优异的性能表现。《开心消消乐》新春扫龙字活动的模型推理性能的测试数据如图4所示，在相同的数据精度下，第五代英特尔®至强®可扩展处理器的代际性能提升1.19倍，而在启用了英特尔® AMX后第五代英特尔®至强®可扩展处理器的推理性能提升5.19倍11。收益通过硬件升级以及软件优化，基于第五代英特尔®至强®可扩展处理器的腾讯云服务器能够显著提升乐元素在模型推理等负载中的性能表现，为其带来以下收益： •满足关卡设计的AI算力需求，提升游戏开发与运营效率：通过高性能的第五代英特尔®至强®可扩展处理器，乐元素获得了充沛的AI算力支撑，能够游刃有余地应对自动打关等模型的推理性能需求，提升游戏开发与运营效率。 •降低成本，实现效益化游戏运营：通过部署基于第五代英特尔®至强®可扩展处理器的腾讯云实例，乐元素无需采用昂贵的专用AI服务器，而且能够按需进行扩展，有助于乐元素在AI战略中获得更高的投资回报率。 •灵活应对其它AI扩展应用：除了关卡设计之外，乐元素还积极在游戏开发与运营的其它环节中引入AI技术，基于第五代英特尔®至强®可扩展处理器的腾讯云可满足这些AI模型推理的算力需求。展望 AI技术已经成为游戏产业发展的热门技术方向，采用生成式人工智能(AIGC)等应用辅助原画设计、角色生成、脚本设计已经广泛盛行，并被应用到大量成功的游戏作品中。一份研究报告预计，2024年AI技术应用将为游戏公司带来约21%的人力成本下降12，释放生产力的同时，人才布局重心将向创新力转移。在此背景下，构建面向游戏开发与运营的AI算力平台，推动AI +游戏应用的创新，成为影响游戏公司竞争力的关键因素。乐元素的实践证实，基于第五代英特尔®至强®可扩展处理器的腾讯云实例S8能够满足典型AI模型在推理算力上的需求，同时具备更高的经济性与灵活性，能够成为游戏企业拓展AI应用的理想选择。在当前合作成果的基础上，英特尔将与腾讯云和乐元素展开更多合作，加快将AI融入到游戏开发与运营的整体流程之中，为玩家带来更加卓越的游戏体验。关于乐元素乐元素成立于2009年，从事移动网络游戏的研发及运营，同时开发原创IP，并提供基于原创IP的演出、音乐、动画片、授权业务和周边商品等产品及服务。乐元素在北京、上海、京都、东京、广州等城市均设有游戏工作室和研究机构，至今已吸纳来自世界各地的人才1500余人。乐元素旗下拥有《开心消消乐》、《开心水族箱》、《海滨消消乐》、《松松总动员》等多款畅销产品，同时也拥有全世界最具影响力的虚拟偶像组合Ensemble Star!《偶像梦幻祭》。乐元素致力于把产品和快乐传递到全世界的每一个角落，「创造更好的娱乐文化体验、让更多人感受到美好与欢乐」。关于腾讯云腾讯云是中国领先的互联网综合服务提供商腾讯集团旗下的云计算品牌，面向全世界各个国家和地区的企

点击免费查看完整报告