行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

大熊团队字节AI全面升级视觉理解模型首次亮相豆包模型家族全

2024-12-18 未知机构晓燚

豆包模型家族全面升级，核心进展包括：

#豆包通用模型：
- 通用模型pro相较于5月15日版本，综合能力提升32%，代码能力提升58%，数学能力提升43%，专业知识领域能力提升54%。
- 目前豆包通用模型pro能力已全面对齐GPT-4o，但价格仅为GPT-4o的1/8。
#文生图模型：
- 2.1版本在业界首次实现精准汉字和一句话P图能力。
豆包视频生成模型：
- 预计2025年春季将推出豆包视频生成模型1.5，具备更强的长视频生成能力。
视觉理解模型：
- 视觉理解模型首次亮相，输入价格为每千tokens 0.003元，比行业平均价格降低85%。
- 已挖掘教育、旅游、电商营销等高价值场景，具备视觉识别、理解推理和视觉描述能力，可根据图像信息进行逻辑计算，完成分析图表、处理代码和解答科学问题等任务。
用户量高速增长：
- 截止12月中旬，豆包通用模型的日均tokens使用量超过4万亿，较5月增长超过33倍。
- 截止11月底，豆包APP在2024年的累计用户规模超1.6亿，日均新增下载量80万。
智能终端进展加速：
- 半年内豆包大模型在智能终端调用量已增长100倍，PC和手机终端设备覆盖约3亿台。
- 豆包已与多数车企合作，后续有望出现更多场景加速放量。

豆包模型家族全面升级。 1）#豆包通用模型：通用模型pro相较5月15日发布版本综合能力+32%、代码能力+58%、数学能力+43%、专业知识领域能力+54%；目前豆包通用模型pro能力已全面对齐GPT-4o，但价格仅为GPT-4o的1/8。 2）#文生图模型：2.1版本在业界首次实现精准汉字和一句话P图能力。【大熊团队】字节AI全面升级，视觉理解模型首次亮相豆包模型家族全面升级。 1）#豆包通用模型：通用模型pro相较5月15日发布版本综合能力+32%、代码能力+58%、数学能力+43%、专业知识领域能力+54%；目前豆包通用模型pro能力已全面对齐GPT-4o，但价格仅为GPT-4o的1/8。 2）#文生图模型：2.1版本在业界首次实现精准汉字和一句话P图能力。豆包视频生成模型：预计2025年春季将推出豆包视频生成模型1.5，具备更强的长视频生成能力。视觉理解模型首次亮相。视觉理解的输入价格为每千tokens 0.003元，比行业平均价格降低85%。目前已挖掘教育、旅游、电商营销等高价值场景。同时模型具备视觉识别、理解推理和视觉描述能力，可根据图像信息进行逻辑计算，完成分析图表、处理代码和解答科学问题等任务。用户量高速增长。截止12月中旬，豆包通用模型的日均tokens使用量超过4万亿，较5月增长超过33倍。截止11月底，豆包APP在24年的累计用户规模超1.6亿，日均新增下载量80万。智能终端进展加速。半年内豆包大模型在智能终端调用量已增长100倍，PC和手机终端设备覆盖约3亿台，同时豆包已与多数车企合作，后续有望出现更多场景加速放量。

点击免费查看完整报告

大熊团队字节AI全面升级视觉理解模型首次亮相豆包模型家族全

你可能感兴趣

计算机行业周报豆包大模型家族迎来全面升级，视觉理解模型迈入“厘时代”

电子周跟踪：字节豆包视觉理解模型超预期，闪极发布首款AI眼镜

电子行业周报：字节豆包视觉理解模型发布，美光科技数据中心业务增长强劲

中泰轻纺豆包视觉理解模型对于AI眼镜意味着什么

中邮AI春节最强音字节AI链1豆包大模型家族日益强盛多模态Age

电子行业周报：字节跳动正式发布豆包视觉理解模型，韩媒报道长鑫存储已成功量产DDR5内存芯片

传媒互联网产业行业周报：豆包视觉理解模型发布，关注税收优惠政策延续的影响

华福AI互联网杨晓峰团队字节豆包APP持续霸榜应用拐点已来

通信行业点评报告：字节Force原动力大会亮点：豆包大模型1.6发布、多模态模型升级、Tokens加速增长、多行业落地

计算机行业点评：豆包突破视觉理解，垂类和终端AI再定义