行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

中国移动“弈衡”大模型评测体系研究及技术发展趋势洞察

2023-11-15 刘伟东中国移动技术能力评测中心 LM

“弈衡”评测是打造中国移动权威第三方评测机构的项目，旨在评测公司“一体五环”重点产品和能力。评测涉及领域广泛，包括文本类、语句类、图像类、语音类等。评测工具包括深度学习、数据库、多线程等，评测方式包括代码生成、基础任务、应用任务等。评测指标包括功能性、准确性、可靠性、安全性、应用性、交互性、多模态能力、任务丰富度、支持完备度、准确度、不确定性、抗攻击性、鲁棒性、社会偏见、合法合规、隐私保护、生态商用、实时性、丰富性、连续性、规范性、公平性、流畅性等。评测场景包括文本分类、目标检测、智能客服等。评测维度包括功能性、准确性、可靠性、安全性、应用性、交互性、多模态能力、任务丰富度、支持完备度、准确度、不确定性、抗攻击性、鲁棒性、社会偏见、合法合规、隐私保护、生态商用、实时性、丰富性、连续性、规范性、公平性、流畅性等。评测工具包括深度学习、数据库、多线程等。评测方式包括代码生成、基础任务、应用任务等。评测指标包括功能性、准确性、可靠性、安全性、应用性、交互性、多模态能力、任务丰富度、支持完备度、准确度、不确定性、抗攻击性、鲁棒性、社会偏见、合法合规、隐私保护、生态商用、实时性、丰富性、连续性、规范性、公平性、流畅性等。

1“弈衡”评测厚积薄发 2大模型发展趋势洞察 3下一步发展展望打造中国移动权威第三方评测机构愿景：成为中国移动核心技术能力的度量衡和磨刀石目标：以公司“一体五环”重点产品和能力评测为中心，打造中国移动权威、中立、客观的第三方技术能力评测机构涉及领域广搭建中国移动技术能力评测图谱，全面助力公司打造优质产品专委会副主任郭嘉丰向中国移动技术能力评测中心主任刘伟东授牌以测选优以评促研积极促进自有大模型提升遴选应用外部优质模型 1“弈衡”评测厚积薄发 2大模型发展趋势洞察 3下一步发展展望 1“弈衡”评测厚积薄发 2大模型发展趋势洞察 3下一步发展展望正在征集首批联盟单位，欢迎大家踊跃报名！联系邮箱：zgydjsnlpczxfs@chinamobile.com 中国移动希望与产业界和学术界携手，共同构建大模型评测合作生态，推进大模型蓬勃发展

点击免费查看完整报告

中国移动“弈衡”大模型评测体系研究及技术发展趋势洞察

你可能感兴趣

高东辉：中国移动“弈衡”大模型评测体系

“弈衡”通用大模型评测体系白皮书

『弈衡』多模态大模型评测体系白皮书

弈衡：多模态大模型评测体系白皮书

『弈衡』人工智能大模型评测平台白皮书

2025年大模型研究系列：多模态大模型洞察大模型向多模态发展深入产业端垂直场景释放技术价值

确定性承载技术和评测体系研究报告（2023年）

AI大模型技术在电力系统中的应用及发展趋势

中国移动游戏服务平台价值研究及发展趋势报告2016

中国通用大模型内容生成及安全性能力评测

中国移动“弈衡”大模型评测体系研究及技术发展趋势洞察

你可能感兴趣

高东辉：中国移动“弈衡”大模型评测体系

“弈衡”通用大模型评测体系白皮书

『弈衡』多模态大模型评测体系白皮书

弈衡：多模态大模型评测体系白皮书

『弈衡』人工智能大模型评测平台白皮书

2025年大模型研究系列：多模态大模型洞察 大模型向多模态发展 深入产业端垂直场景释放技术价值

确定性承载技术和评测体系研究报告（2023年）

AI大模型技术在电力系统中的应用及发展趋势

中国移动游戏服务平台价值研究及发展趋势报告2016

中国通用大模型内容生成及安全性能力评测

2025年大模型研究系列：多模态大模型洞察大模型向多模态发展深入产业端垂直场景释放技术价值