行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

高东辉：中国移动“弈衡”大模型评测体系

信息技术 2024-01-17 中国移动研究院 xx翔

中国移动技术能力评测中心概况

核心定位：

权威第三方评测机构：中国移动技术能力评测中心致力于成为国家主权企业（简称国资央企）核心技术能力的权威评测机构。
技术覆盖广：涵盖人工智能的多个技术领域，如视觉、语音、图像、视频处理等。

主要目标：

打造评测中心：以中国移动的重点产品和能力为核心，构建权威、中立、客观的第三方技术评测平台。
全面评测能力：提供从底层共性技术到AI能力引擎栈的全方位评测，包括但不限于图像、语音、视频分析、数据处理等。

应用场景：

智能运维：通过智慧运维提高系统效率和稳定性。
智慧营销：利用数据分析优化营销策略。
智能推荐：实现个性化智能推荐服务。

技术创新：

智能业务识别：自动识别和分析各类智能业务需求。
智能运维：提供智能化运维解决方案。
大数据风控：利用大数据技术提升风险管理能力。

行业合作：

大模型评测：与中国中文信息学会合作，推动大模型技术评测工作。
技术峰会：与行业头部企业（如百度、科大讯飞、清华、北邮等）共同研讨大模型评测及应用。
国内外评测：对国内外主流大模型进行多轮评测，形成洞察分析报告。

市场布局：

国内评测：与北京市政府合作，评测当地主流大模型，支持集团开展常态化评测工作。
国际合作：关注国际大模型市场动态，参与全球大模型技术交流与评测。

未来展望：

构建评测体系：建立健全人工智能测试评估体系，服务国资央企大模型应用。
推动大模型发展：与中央企业合作，共建评测生态，促进大模型技术的创新与应用。

主要成就与亮点

技术覆盖全面：涵盖人工智能领域多个技术分支，具备从底层技术到上层应用的全栈评测能力。
国际合作与交流：与国际头部企业和研究机构合作，参与全球大模型技术评测，促进国际交流。
市场影响力：在国内市场与北京市政府紧密合作，对大模型进行深入评测，为政策制定提供依据。
技术创新与领导力：在大模型评测领域处于领先地位，参与制定评测标准，引领行业发展趋势。

结论

中国移动技术能力评测中心凭借其广泛的技术覆盖、全面的评测能力、深入的市场合作以及卓越的技术创新，在大模型评测领域展现出了强大的实力和领导力，为中国乃至全球的人工智能技术发展做出了重要贡献。

中国移动技术能力评测中心打造国资央企权威第三方评测机构愿景：成为国资央企核心技术能力的度量衡和磨刀石目标：以公司“一体五环”重点产品和能力评测为中心，打造权威、中立、客观的第三方技术能力评测机构涉及领域广助力打造优质产品，绘制并逐步拓展CHBNGV全领域技术能力评测能力为促进大模型技术进步和产业发展，推进大模型评测工作，中国中文信息学会正式成立CCIR大模型评测工作组，并由专委会副主任郭嘉丰向中国移动技术能力评测中心主任刘伟东授牌召开大模型评测技术峰会，推进行业发展组织百度、讯飞、清华、北邮、中国科学院计算所、中国信通院等业界头部企业及机构，召开“众智评鉴、测行致远”大模型评测及应用研讨会，发布业界首个评测体系白皮书承接各级大模型评测任务，促进国产大模型成熟应用省部级国家级集团级根据国资委要求，落实战新大模型评测任务，助力国资央企大模型成熟ü构建国内市场通用、公认的人工智能测试评估体系，健全人工智能服务体系ü为国资央企大模型提供评测服务支撑集团开展常态化评测工作ü对国内外30余款主流大模型开展多轮评测ü形成洞察分析报告，助力大模型决策与北京市政府合作，评测北京市主流大模型 ü聚焦教育、医疗、政务、交通等领域的业务场景，对政务行业大模型开展评测ü为北京市发展大模型编写内参中国移动希望与中央企业携手，共同构建大模型评测合作生态，推进大模型蓬勃发展

点击免费查看完整报告

高东辉：中国移动“弈衡”大模型评测体系

中国移动技术能力评测中心概况

主要成就与亮点

结论

你可能感兴趣

中国移动“弈衡”大模型评测体系研究及技术发展趋势洞察

“弈衡”通用大模型评测体系白皮书

『弈衡』多模态大模型评测体系白皮书

弈衡：多模态大模型评测体系白皮书

『弈衡』人工智能大模型评测平台白皮书

2024年中国移动智能硬件评测报告-手机AI性能

2024年中国移动智能硬件评测报告-北斗定位

2024年中国移动智能硬件评测报告高清视频彩铃

2024年中国移动智能硬件评测报告-手机游戏性能

2024年中国移动智能硬件评测报告-5G消息