【大熊团队】字节AI全面升级,视觉理解模型首次亮相豆包模型家族全面升级。 1)#豆包通用模型:通用模型pro相较5月15日发布版本综合能力+32%、代码能力+58%、数学能力+43%、专业知识领域能力+54%;目前豆包通用模型pro能力已全面对齐GPT-4o,但价格仅为GPT-4o的1/8。 2)#文生图模型:2.1版本在业界首次实现精准汉字和一句话P图能力。 【大熊团队】字节AI全面升级,视觉理解模型首次亮相豆包模型家族全面升级。 1)#豆包通用模型:通用模型pro相较5月15日发布版本综合能力+32%、代码能力+58%、数学能力+43%、专业知识领域能力+54%;目前豆包通用模型pro能力已全面对齐GPT-4o,但价格仅为GPT-4o的1/8。 2)#文生图模型:2.1版本在业界首次实现精准汉字和一句话P图能力。 3)#音乐模型:实现可生成3分钟的完整作品,实现包括前奏、主歌、副歌、间奏、过渡段等复杂结构的作品创作。 4)#豆包视频生成模型:预计2025年春季将推出豆包视频生成模型1.5,具备更强的长视频生成能力。视觉理解模型首次亮相。 视觉理解的输入价格为每千tokens0.003元,比行业平均价格降低85%。目前已挖掘教育、旅游、电商营销等高价值场景。 同时模型具备视觉识别、理解推理和视觉描述能力,可根据图像信息进行逻辑计算,完成分析图表、处理代码和解答科学问题等任务。 用户量高速增长。 截止12月中旬,豆包通用模型的日均tokens使用量超过4万亿,较5月增长超过33倍。截止11月底,豆包APP在24年的累计用户规模超1.6亿,日均新增下载量80万。 智能终端进展加速。 半年内豆包大模型在智能终端调用量已增长100倍,PC和手机终端设备覆盖约3亿台,同时豆包已与多数车企合作,后续有望出现更多场景加速放量。