腾讯混元大模型(Tencent Hunyuan)是由腾讯全链路自研的通用大模型,拥有万亿参数规模,具备强大的中文创作能力、复杂语境下的逻辑推理能力、可靠的任务执行能力以及出色的多模态理解和生成能力。腾讯混元API支持 AI 搜索联网插件,通过整合腾讯优质的内容生态如新闻、音乐、地图等,提供强大的时新、深度内容获取和AI问答能力。 目前,腾讯混元大模型已全面接入腾讯内部业务,赋能各个产品,并通过腾讯云向广泛的开发者与企业客户开放使用,加速大模型技术落地和产业智能化的进程。 公开benchmark测评 表现对标国际头部 数学、代码指标显著提升表现对标国际头部 数据来源:SuperCLUE,2024年9月2日注:由于部分模型分数较为接近,为了减少问题波动对排名的影响,本次测评将相距2分区间的模型定义为并列,报告中分数展示以并列模型高分为主。 混元生文 混元生图 基于腾讯混元文生图大模型,可结合输入的文本描述智能创作出与输入相关的图像内容,提供更高质量的图像创作、更强大的中文语义理解能力以及更广泛的应用场景。 基于自然语言对话的方式,可结合输入的文本输出相关文本内容,可在角色扮演、AI搜索、智能客服、作业批改等场景服务各类行业。 高质量图像 更强大的中文语义理解 提示词智能扩写 多样化风格 混元多模态 混元生视频 基于腾讯混元文生视频模型,用户只需要输入一段描述,即可生成视频,支持中英文双语输入、多种视频尺寸以及多种视频清晰度,可用于工业级商业场景例如广告宣传、动画制作、创意视频生成等场景。 支持在对话中输入图片生成文本,包括图片基础识别、图片内容创作、图片多轮对话、图片知识问答、图片分析推理、图片OCR 等能力。 超写实质感 强大的多模态通用能力 中英文均衡 更多版本,保障效果、性能 支持多轮图像问答 角色扮演 根据不同故事背景,大模型扮演特定角色,陪伴用户聊天推动故事发展的情景,比如虚构角色、游戏NPC、情感陪聊等。 场景描述 hunyuan-role[最大输入28k,最大输出4k]模型,积累了丰富的角色扮演数据,相比通用模型,hunyuan-role模型在互动语气、剧情推进、多轮对话等场景中效果更优。 应用方案 客户案例某角色扮演赛道头部产品公司 作为集合多种AI场景的互动内容平台,需要AI能根据人物设定和故事背景,具备高度拟人化故事情节推进、角色设定遵循、长记忆等能力,扮演用户的“亲密朋友”满足其情感陪伴和精神寄托的需求。hunyuan-role模型为客户提供高拟人化、智能化的大模型能力,是支撑角色扮演场景的核心能力,助力优化用户体验和业务指标。 AI搜索 场景描述在回答提问时,大模型通过搜索引擎获取信息,并基于搜索引擎返回的内容进行理解和总结,最终生成较好回答。 基于hunyuan-turbo[最大输入28k,最大输出4k]模型,全新的MOE架构,内部集成了联网搜索能力,可基于用户query准确搜索信源,并通过大模型总结答案,具备很强的推理效率和效果表现。 应用方案 客户案例某头部搜索公司推出的AI搜索产品 在该搜索引擎内的“AI问答”模块,使用混元作为搜索总结模型(使用该搜索引擎的搜索结果),进行通用问答、垂直领域(如音乐、游戏、笑话)问答。相比传统搜索,AI搜索节省了用户通过链接查找答案的过程,过滤掉了无效内容和广告,直接给出对应的答案,大幅提升了搜索效率和准确度。 作业批改 使用大模型对学生的作业(文本或者图片)进行试题解析和作业批改,自动生成作文评价、考试分数,帮助老师提高作业批改效率。 场景描述 用hunyuan-turbo模型、hunyuan-vision模型、ocr原子能力,适用于成人教育中语文、数学、英语、编程等多个学科场景及各种职业考试场景。 应用方案 客户案例 考试宝 在拍照搜题、试题录入场景,考试宝使用hunyuan-vision高效识别试题和答案,解决传统OCR识别不准确的问题,再用hunyu-an-turbo把试题解析自动化和智能化。运行数据显示,考试宝每天可实现千万级别的试题解析,试题识别和解析效率提升了98%。 少年得到 少年得到为一款专为K12用户提供学习服务的APP。在K12语文作文批 改 场 景 下 , 学 生 会 提 交 大 量 的 语 文 作 文 内 容 , 依 靠 h u n y u -an-turbo模型对作文内容进行批改和点评,可以大幅提升作文批改的效率。 对话标签 场景描述大模型对“人-人”、”人-机“会话内容进行分类和标识的情景,通过分析会话内容并提取标签做意图分析,适用于文本对话分析、语音外呼分类以及客服质检等场景。 应用方案基于hunyuan-turbo模型,对常见标签提取准确率达95%+。