您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[腾讯]:腾讯混元大模型PaaS产品及案例手册 - 发现报告

腾讯混元大模型PaaS产品及案例手册

2025-01-22腾讯华***
腾讯混元大模型PaaS产品及案例手册

腾讯混元大模型PaaS产品及案例手册 腾讯混元大模型(TencentHunyuan)是由腾讯全链路自研的通用大模型,拥有万亿参数规模,具备强大的中文创作能力、复杂语境下的逻辑推理能力、可靠的任务执行能力以及出色的多模态理解和生成能力。腾讯混元API支持AI搜索联网插件,通过整合腾讯优质的内容生态如新闻、音乐、地图等,提供强大的时新、深度内容获取和AI问答能力。 目前,腾讯混元大模型已全面接入腾讯内部业务,赋能各个产品,并通过腾讯云向广泛的开发者与企业客户开放使用,加速大模型技术落地和产业智能化的进程。 技术能力 腾讯混元大模型推陈出新,不断突破业内MoE大模型天花板,效果更好,速度更快。 万亿级层间异构MoE 更多专家数、更小激活量 0.10元/千tokens 比腾讯混元Pro价格再低50% 推理效率 100% 推理成本 50% 解码速度 20% 0.05元/千tokens 0.03元/千tokens 0.015元/千tokens 腾讯混元Pro腾讯混元Turbo腾讯混元Pro腾讯混元Turbo 输出输入 公开benchmark测评表现对标国际头部数学、代码指标显著提升 中文场景对标GPT-4o,领先国内大模型 100 90 80 70 60 50 40 30 20 10 0 MMLU BBH HellaSwag DROP GPQA_diamond MATH HumanEvalC-Eval CMMLU 腾讯混元Turbo国内头部大模型1国内头部大模型2GPT4o* Claude3.5-sonnetLlama3.1-405B-instruct 公开benchmark指标位于第一梯队,超过国内系列大模型对标GPT-4o,数字和代码指标大幅提升 腾讯混元大模型不断升级,效果稳居国内第一梯队。(根据权威第三方评测结果)语言模型能力达到国内第一。(2024Q4) SuperCLUE模型象限SuperCLUE通用能力基准测评 数据来源:SuperCLUE,2024年9月2日数据来源:SuperCLUE,2024年9月2日 注:由于部分模型分数较为接近,为了减少问题波动对排名的影响,本次测评将相距2分区间的模型定义为并列,报告中分数展示以并列模型高分为主。 腾讯混元多模态图生文MoE模型效果国内第一。(根据权威第三方评测结果) SuperCLUE-V多模态模型象限SuperCLUE-V多模态理解测评基准总榜 来源:SuperCLUE,2024年8月2日 象限由两个维度的组成。基础能力,包含:粗粒度视觉认知、细粒度视觉认知、数理逻辑分析、多模态注多轮问答;应用能力,包含:通用场景、常识问答、图像OCR识别与理解、中文元素理解和推理。 技术优势 腾讯混元大模型特点和基础能力 万亿参数规模 强大的中文创作能力 复杂语境的逻辑推理能力 长上下文窗口 腾讯混元大模型 可靠的任务执行能力 相当于全国公共图书馆 藏书量的训练语料 出色的多模态理解和生成能力 混元生文 基于自然语言对话的方式,可结合输入的文本输出相关文本内容,可在角色扮演、AI搜索、智能客服、作业批改等场景服务各类行业。 混元生图 基于腾讯混元文生图大模型,可结合输入的文本描述智能创作出与输入相关的图像内容,提供更高质量的图像创作、更强大的中文语义理解能力以及更广泛的应用场景。 多轮对话 内容创作 逻辑推理 知识增强 高质量图像更强大的中文语义理解 提示词智能扩写 多样化风格 混元生视频 基于腾讯混元文生视频模型,用户只需要输入一段描述,即可生成视频,支持中英文双语输入、多种视频尺寸以及多种视频清晰度,可用于工业级商业场景例如广告宣传、动画制作、创意视频生成等场景。 混元多模态 支持在对话中输入图片生成文本,包括图片基础识别、图片内容创作、图片多轮对话、图片知识问答、图片分析推理、图片OCR等能力。 超写实质感高语义遵循动态画面流畅原生镜头转换 强大的多模态支持多轮通用能力图像问答 中英文均衡更多版本, 保障效果、性能 PaaS产品介绍 角色扮演 场景描述根据不同故事背景,大模型扮演特定角色,陪伴用户聊天推动故事发 展的情景,比如虚构角色、游戏NPC、情感陪聊等。 应用方案hunyuan-role[最大输入28k,最大输出4k]模型,积累了丰富的角色 扮演数据,相比通用模型,hunyuan-role模型在互动语气、剧情推 进、多轮对话等场景中效果更优。 客户案例某角色扮演赛道头部产品公司 作为集合多种AI场景的互动内容平台,需要AI能根据人物设定和故事背景,具备高度拟人化故事情节推进、角色设定遵循、长记忆等能力,扮演用户的“亲密朋友”满足其情感陪伴和精神寄托的需求。hunyuan-role模型为客户提供高拟人化、智能化的大模型能力,是 支撑角色扮演场景的核心能力,助力优化用户体验和业务指标。 AI搜索 场景描述 在回答提问时,大模型通过搜索引擎获取信息,并基于搜索引擎返回 的内容进行理解和总结,最终生成较好回答。 台风是怎么形成的 应用方案基于hunyuan-turbo[最大输入28k,最大输出4k]模型,全新的 MOE架构,内部集成了联网搜索能力,可基于用户query准确搜索 信源,并通过大模型总结答案,具备很强的推理效率和效果表现。 客户案例某头部搜索公司推出的AI搜索产品 在该搜索引擎内的“AI问答”模块,使用混元作为搜索总结模型(使用该搜索引擎的搜索结果),进行通用问答、垂直领域(如音乐、游戏、笑话)问答。相比传统搜索,AI搜索节省了用户通过链接查找答案的过程,过滤掉了无效内容和广告,直接给出对应的答案,大幅提 升了搜索效率和准确度。 混元生文-核心场景 对话标签 场景描述大模型对“人-人”、”人-机“会话内容进行分类和标识的情景,通过分析会话内容并提取标签做意图分析,适用于 文本对话分析、语音外呼分类以及客服质检等场景。 应用方案基于hunyuan-turbo模型,对常见标签提取准确率达95%+。 作业批改 场景描述使用大模型对学生的作业(文本或者图片)进行试题解析和作业批 改,自动生成作文评价、考试分数,帮助老师提高作业批改效率。 应用方案用hunyuan-turbo模型、hunyuan-vision模型、ocr原子能力, 适用于成人教育中语文、数学、英语、编程等多个学科场景及各种职 业考试场景。 客户案例 考试宝 在拍照搜题、试题录入场景,考试宝使用hunyuan-vision高效识别试题和答案,解决传统OCR识别不准确的问题,再用hunyu-an-turbo把试题解析自动化和智能化。运行数据显示,考试宝每天可实现千万级别的试题解析,试题识别和解析效率提升了98%。 少年得到 少年得到为一款专为K12用户提供学习服务的APP。在K12语文作文批改场景下,学生会提交大量的语文作文内容,依靠hunyu-an-turbo模型对作文内容进行批改和点评,可以大幅提升作文批改的效率。 扫码关注 腾讯云AI官方账号 扫描获取 需求快速合作通道