事项: 5月30日,腾讯混元全面升级,推出大模型APP「腾讯元宝」。「腾讯元宝」是腾讯推出的一款基于混元大模型的AI助手App,旨在为用户提供一系列AI服务,其主要聚焦于AI效率工具,提供AI搜索、AI总结、AI写作等核心能力,能够直接同时解析多个网址和公众号链接以及PDF、word、txt等多种格式的文档,并支持超长窗口。 评论: 聚焦工作与生活提效,玩法更丰富,功能更实用。「腾讯元宝」的核心能力包括AI效率工具、AI特色应用。面向工作效率场景,「腾讯元宝」是一站式AI效率工具,包括1)AI搜索:接入微信搜一搜、搜狗搜索、微信公众号等,并通过AI搜索增强提升时效性;2)AI总结:支持超长上下文窗口(最高256K,相当于一本《三国演义》的文字量),支持图片、文件、语音、链接等多种输入格式,一次性解析最多10个PDF/word/txt;3)AI写作:支持大纲等结构化输出,结构清晰、重点突出。面向日常生活场景,「腾讯元宝」汇聚了丰富的AI特色应用,如口语陪练、超能翻译官、创意绘画、百变AI头像等官方智能体。此外,「腾讯元宝」支持根据用户个性化需求,快速创建个人专属智能体,支持复刻个人音色。 「腾讯元宝」产品侧能力升级,源自于混元底层模型持续迭代。当前版本腾讯混元大模型的参数规模已从千亿升级至万亿,预训练语料从万亿升级至7万亿tokens,并率先升级为多专家模型结构(MoE),整体性能相比Dense版本提升超50%。当前版本模型实现生文更准确(AI搜索增强,256K窗口上下文,数理能力提升50%)、生图更逼真(首个国内中文DiT开源模型)、生视频/3D更长&分辨率更高(支持最长16秒视频生成,单图30s生成3D模型,St-DiT全面升级架构)。 混元于腾讯,是AI竞争的手牌与业务提效的飞轮;腾讯于混元,是生态赋能的支柱与迭代反哺的引擎。从「腾讯元宝」的功能特色上观察。我们认为对于腾讯来说,混元与元宝既是其在AI浪潮中与其他科技巨头竞争的手牌,又是可直接内部提高效率的工具,目前腾讯内部有超600个业务及场景已接入腾讯混元;而对于混元与元宝来说,腾讯生态为其赋能了诸如微信公众号内容等的差异化数据,以及在腾讯丰富的生态中迭代进一步反哺混元与元宝能力的提升,实现数据飞轮。 国产模型持续迭代追赶,大模型价格战打响,看好AI产业应用侧景气度提升。 近期,海内外多家科技巨头更新AI进展,包括OpenAI、谷歌、字节跳动、腾讯等,模型交互能力实现重大突破。此外,多家大模型厂商纷纷官宣调用价格下降,包括智谱、字节跳动、阿里、百度、腾讯与科大讯飞等,我们认为AI底层模型降价趋势是AI竞争中的一大关键阶段,有望在中短期内延续。从大模型侧看,我们认为大模型竞争从能力指标延续到成本竞争,竞争进一步加剧,探索AI模型商业化平衡与技术追赶将持续成为国产大模型主基调。从下游应用侧看,我们认为大模型厂商价格战利好应用开发成本降低,看好AI应用开发者生态,看好AI应用全赛道景气度提升与产品加速落地。 风险提示:政策监管趋严,AI产品商业化不及预期 一、产品简介 「腾讯元宝」是腾讯于2024年5月30日推出的一款基于混元大模型的to c AI助手App。 其核心能力包括AI效率工具、AI特色应用,主要面向工作效率与日常生活场景提供AI搜索、AI总结、AI写作等核心能力。目前,腾讯内部有超600个业务及场景已接入腾讯混元,在腾讯丰富的内容生态中有望进一步反哺元宝APP能力提升。「腾讯元宝」产品侧能力升级,源自于混元底层模型持续迭代。当前版本腾讯混元大模型的参数规模已从千亿升级至万亿,预训练语料从万亿升级至7万亿tokens,并率先升级为多专家模型结构(MoE),整体性能相比Dense版本提升超50%。当前版本模型实现生文更准确(AI搜索增强,256K窗口上下文,数理能力提升50%)、生图更逼真(首个国内中文DiT开源模型)、生视频/3D更长&分辨率更高(支持最长16秒视频生成,单图30s生成3D模型,St-DiT全面升级架构)。 二、功能模块 (一)面向工作效率场景,「腾讯元宝」是一站式AI效率工具。 1、AI搜索 元宝的AI搜索模块接入了微信公众号高质量内容,搜索结果佳。元宝接入微信搜一搜、搜狗搜索等搜索引擎,并通过AI搜索增强,确保内容的高时效性(内容涵盖微信公众号,信息更全、内容更准)。AI搜索答案以引入-分点分析-总结为主要格式,并在开头提供引用资料链接,结尾提供推荐内容链接,点击链接即可在App中查看,无需跳转。生成结果可直接分享至微信好友和朋友圈,也可以生成图片和链接。另外会提供在答案后相关内容链接。 图表1元宝AI搜索模块接入了微信公众号高质量内容 2、AI总结 256k超长上下文窗口,50+超大文件上传解析量。元宝可以根据客户需求快速对输入内容快速总结,在浏览大量信息的同时能迅速抓住信息重点,并且可以根据总结内容提问。 具备256k超长的上下文窗口,支持图片、文件、语音等多种输入格式,同时支持外部网址链接或公众号链接上传,发送链接后会自动阅读内容并生成内容总结,根据产品最新情况,AI总结能一次上传并解析最多50个PDF/word/txt文件,文件不能超过100MB。 图表2元宝可支持 10M 图片和50个总体积 100M 的上传解析 3、AI创作 结构化条理性的内容生成,实现一键交稿。元宝可根据在搜索栏里输入需求生成文案、报告、策划案等内容,输出内容逻辑条理清晰,结构清楚,以“零食店开业活动方案”为例,包含目标,持续时间,事前、事中、事后计划,预算以及评估,内容完成,框架清晰。 图表3元宝条理性的创作能力 (二)面向日常生活场景,「腾讯元宝」汇聚了丰富的AI特色应用。 1、AI绘图 领先的生图速度与高质量的生图质量。元宝可以根据文字描述来生成图片,作图速度快,领先于市面其他大模型,在提高生图速度的同时保证了图片的质量,生图内容也贴近作图需求。以生成“落霞与孤鹜齐飞,秋水共长天一色”以及“亚洲高冷女生,穿着黑色衣服,室内,冷色调”的图片为例,每张图片生成只需7s,生成内容完全贴合语义。 图表4元宝生成“落霞与孤鹜齐飞,秋水共长天一色”图片 图表5元宝生成“亚洲高冷女生,穿着黑色衣服,室内,冷色调”图片 2、智能体 智能体拓展元宝垂直领域应用。通过页面上端【发现】进入智能体界面,腾讯元宝提供多种官方智能体,包括口语陪练、超能翻译官、创意绘画等。口语陪练提供选择话题、设置难度、笔记本等功能;超能翻译官支持同声传译;创意绘画可以选择图片风格、比例、分辨率等。官方提供的智能体玩法多样、功能齐全。用户也可以创建自己的智能体,从头像、名称、音色、权限、简介、开场白、预制指令等方面创建个性化智能体。同时元宝提供AI生成功能,用户只需输入智能体名称,便可AI生成剩余内容。特别是百变AI头像,通过智能体实现了固定流程的功能模块,不需要通过写promt就能实现头像的生成。 图表6腾讯元宝官方智能体 图表7腾讯元宝百变AI头像 此外用户可以选择语音朗读搜索内容,语音声音可以选择音色也可以创建自己的音色包,从而使用户在与智能体交流时更具有带入性。另外首页会根据时段推送当日新闻,点击即可查看新闻标题和摘要,点击标题进入腾讯新闻页面查看 图表8腾讯元宝语音设置 图表9腾讯元宝新闻推送