事项: 4月23日,商汤揭晓“日日新SenseNova 5.0”多模态大模型,模型采用混合专家架构,经过超过10TB tokens的训练,覆盖大量合成数据,显著提升模型的推理能力和上下文理解窗口,聚焦知识、数学、推理及代码能力增强,全面对标GPT-4 Turbo。 评论: 商汤发布日日新5.0,模型能力有望对标GPT4-Turbo。商汤发布的“日日新SenseNova5.0”大模型是其体系内的第五个版本迭代,采用混合专家架构和超10TB tokens训练,显著增强了知识、数学、推理及代码能力。该模型在语言和创意能力上有明显提升,可更好地理解、总结和回答问题,为教育和内容行业提供支持。同时,SenseChat Lite利用端云联动MoE框架,降低推理成本,在中等和高端手机上的推理速度分别达到18.3和78.3字/秒。在科学能力方面,SenseNova 5.0展现出卓越的数学、编码和推理能力,对标GPT-4 Turbo,达到或超越其性能。此外,该模型还具备多模态能力,支持高清图像解析、文生图、跨文档知识抽取及总结问答展示等,并在多个权威测试中取得高分。其端侧LDM-AI扩图技术实现业内最快推理速度,支持高清图片输出和多种图像编辑功能。 垂直领域落地丰富应用,专用大模型应用可期。商汤科技通过集成大模型,赋能产业升级,并在金融、编码、医疗保健和政府服务等关键领域实现丰富应用。 其大模型以低CPU利用率和高效率降低推理成本,与金山办公合作提供智能办公平台,与海通证券合作推动金融行业数智化转型,同时应用于小米汽车SU7的智能车舱,提升智能化交互体验。商汤还发布了基于昇腾原生的行业大模型,打造大模型产业生态。这些举措展示了商汤在垂直领域的深厚实力和应用前景,为企业和行业提供智能化解决方案,推动产业升级和发展。 投资建议:坚定看好今年多模态大模型的投资机遇,预计今年海内外大模型厂商都将持续蓄力,加速多模态大模型的发展及应用。重点推荐国内多模态核心标的万兴科技,建议关注昆仑万维、虹软科技、当虹科技、国投智能等。同时,AI大模型本质应落脚垂类应用,看好AI+应用产品力与商业化落地进程。建议持续关注AI+应用侧:1)办公:金山办公、福昕软件;2)法律:金桥信息、华宇软件、通达海;3)医疗:润达医疗;4)教育:佳发教育、欧玛软件、新开普;5)金融:同花顺、新致软件;6)邮箱:彩讯股份;7)传媒:掌阅科技、华策影视;8)电商:焦点科技。算力侧:1)算力基础:润泽科技、亚康股份、海光信息、寒武纪、龙芯中科;2)服务器:中科曙光、浪潮信息、紫光股份、神州数码、拓维信息。 风险提示:商业化后表现不及预期,用户付费意愿低,行业技术迭代速度较快。 一、商汤发布日日新5.0,模型能力有望对标GPT4-Turbo 商汤“日日新SenseNova5.0”大模型于4月23日发布。去年4月首次发布至今,商汤“日日新SenseNova”大模型体系已正式推出五个大版本迭代。日日新5.0采用混合专家架构(MoE),超10TB tokens训练,覆盖大量合成数据,推理时上下文窗口达200K左右。 本次更新主要聚集增强了知识、数学、推理及代码能力,全面对标GPT-4 Turbo,主流客观评测上达到或超越GPT-4 Turbo。 图表1日日新SenseNova5.0的主要更新亮点 在语言和创意能力方面,SenseNova 5.0的创意写作、推理和总结能力都有了明显的提升。 在相同的知识输入下,它提供了更好的理解、总结和问答,为教育和内容行业等垂直应用程序提供了强有力的支持。在4月23日发布会上,商汤CEO徐立直接在手机上测试在离线模式下生成员工请假一周的申请,并且可以对长段文字做快速总结。在推理能力方面,SenseChat Lite则是采用了端云“联动”的MoE框架,在部分场景中端侧推理占70%,会让推理成本变得更低。具体而言,对比人眼20字/秒的阅读速度来说,SenseChat Lite在中等性能手机上,可以达到18.3字/秒推理速度,而在高端旗舰手机,推理速度可以上升到78.3字/秒。 在科学能力方面,SenseNova 5.0拥有一流的数学、编码和推理能力,为金融和数据分析方面的应用提供了坚实的基础。本次更新主要聚集增强了知识、数学、推理及代码能力,全面对标GPT-4 Turbo,主流客观评测上达到或超越GPT-4 Turbo。 图表2日日新SenseNova5.0的各项测试结果 SenseNova 5.0在应用产品层面也实现了更卓越的多模态能力。它支持高清图像解析和理解,以及文本到图像的生成。此外,它还可以跨文档提取复杂数据,并对问题的答案进行总结,具有丰富的多模态交互能力。目前,SenseNova 5.0以世界领先的图形和文本感知能力在多模态大模型权威综合基准测试MMBench中综合得分排名首位。除此之外,它在MathVista、AI2D和ChartQA等其他知名的多模式榜单中也取得了高分。扩散模型同样可在端侧实现业内最快的推理速度,端侧LDM-AI扩图技术在某主流平台上,推理速度小于1.5秒,比友商云端app快10倍,支持输出1200万像素及以上的高清图片,支持在端上快速进行等比扩图、自由扩图、旋转扩图等图像编辑功能。 图表3 AI扩图功能演示 二、垂直领域落地丰富应用,专用大模型应用可期 赋能产业升级,垂直领域落地丰富应用。商汤集成大模型是为了应对金融、编码、医疗保健和政府服务等关键领域对人工智能日益增长的需求而开发的。与其他类似产品相比,该设备仅以50%的CPU利用率执行加速搜索,并将推理成本降低了大约80%。 图表4商汤科技AI+应用 在办公领域,商汤科技自2023年起与金山办公合作,利用SenseNova大型模型为金山办公的WPS 365提供智能办公平台,提高办公效率和整体效,为企业构建专属的“企业大脑”。 在金融领域,海通证券与商汤科技联合发布金融行业多模态全栈式大模型,双方在智能客服、合规风控、代码辅助、展业办公助手等领域助推业务落地,并共研智能投顾、舆情监控等行业前沿场景,打通证券行业大模型落地的全栈式能力。 在汽车领域,近期火爆市场的小米汽车SU7的智能车舱中就应用了商汤的大模型技术,基于商汤端云大模型解决方案,小米小爱同学为车主提供智能化交互体验。 此外,商汤还发布了基于昇腾原生的行业大模型,共同打造面向金融、医疗、政务、代码、文娱等大模型产业生态。 图表5商汤科技与金山办公合作