大模型多模态技术迭代,助推AI应用快速实现。谷歌Gemini 1.0和Pika 1.0的发布,多模态大模型迎来重大突破。多模态技术结合不同感知模态(图像、视频、音频等),使计算机系统能同时处理和理解多种数据类型,提高对世界的全面认知和理解能力,仿效人类在多感觉模式下的综合认知。多模态技术演进推动多类AI+应用落地,其中包括AI+绘图、AI+视频等应用。AI扩图是多模态分支之一,基本原理是利用AI技术扩展图像。 智能商拍产品市场化进程持续推进。WeShop是国内首个AI商拍产品,服务场景适配多种电商场景,包含人台\真人\商品等应用场景。品牌方无需再受到模特,经纪,摄影,后期,场租以及机酒的限制,在高效产出优质商品图的同时,还能大幅节约拍摄成本。虹软科技自身主攻计算机视觉业务,深耕大模型相关应用领域。2023年10月发布了全新产品——PhotoStudio® AI智能商拍摄影云工作室(Beta版)。该产品旨在为电商、团队和个人提供全面的商业拍摄解决方案,为其打造高效、智能的商业摄影解决方案。借助虹软先进的视觉技术,PhotoStudio® AI还提供更强大的图像处理功能,以满足客户的多样化需求。 PhotoStudio® AI与WeShop使用体验对比。采取市场中使用较为广泛的两种AI商拍产品进行体验测试。本次体验的AI商拍产品功能点基本一致,但其成品表现存在一定差异。PhotoStudio功能操作简单,目前仅支持基础操作,在本次同一人台图测试所得四张生成图中,成功率较高。WeShop操作较为专业,支持对象较多,部分功能需要对软件进行学习使用。在本次同一人台图测试所得四张生成图中,模特效果有待改进。 投资建议与标的:多模态技术高速发展,文生图、文生视频能力未来可期,AI+绘图、AI+视频值得关注。建议关注多模态应用和大模型基座相关标的:1)AI+绘图:万兴科技;2)AI+视频:当虹科技、虹软科技;3)大模型基座:科大讯飞。 风险提示:大模型研发不及预期、政策不及预期、行业竞争加剧。 一、多模态高速迭代,智能商拍产品市场化进程持续推进 大模型多模态技术迭代,助推AI应用快速实现。谷歌Gemini 1.0和Pika 1.0的正式发布,多模态大模型迎来重大突破。多模态技术是一种结合不同感知模态(例如图像、视频、音频)的技术,旨在使计算机系统能够同时处理和理解多种类型的数据。通过整合多种感知方式,多模态技术旨在提高计算机对世界的全面认知和理解能力,模拟人类在多种感觉模式下的综合认知能力。多模态技术的快速演进推动了一些AI+应用场景的实现,例如:AI+绘图、AI+视频等类型的AI应用落地。AI扩图就是多模态领域的分支之一,旨在利用AI技术以及算法对图像进行扩展。 图表1 Pika效果图 多模态智能座舱布局,提升用户体验的全面性和智能水平。多模态智能座舱布局是在整合不同感知模态的基础上,推出的一种智能化的用户界面设计。通过整合视觉、语音等多种感知方式,用户可以更自然、便捷地与智能系统进行交互。这种座舱布局的设计旨在提高用户体验的全面性和智能化水平。AI多模态布局旨在通过整合不同感知模态,提供更全面、智能的解决方案,尤其在视觉业务和大模型应用方面有着显著的优势。 WeShopAI商拍软件,国内首款AIGC商拍工具。根据WeShop的官网信息显示,WeShop是国内首个AI商拍产品,其服务场景广泛适配多种电商应用场景,包括人台、真人、商品等多种应用场景。这一创新性的商拍模式为品牌方带来了诸多便利,摆脱了以往模特、经纪、摄影、后期处理、场地租赁等方面的诸多限制。在使用WeShop的平台服务的过程中,品牌方能够以高效的方式生成优质的商品图像,同时极大地降低了拍摄成本,不再需要为拍摄流程中的繁琐环节而担忧。这一全新商拍模式的引入不仅为电商行业注入了创新活力,也为品牌方提供了更灵活、高效的商品推广和展示手段。WeShop以其独特的商拍技术,成为品牌方在数字化时代颇具竞争力的合作伙伴。 虹软科技技术布局,国内计算机视觉领域领先。虹软科技坚持技术聚焦,注重技术与行业结合的应用经验,主攻计算机视觉业务,深耕大模型相关应用领域。根据虹软官网信息显示,公司主要以视觉业务为核心,围绕该业务进行大模型相关应用的开发和推广。 多模态智能座舱布局是虹软在不同感知模态(例如视觉、语音等)上进行整合和创新的结果,旨在提供更全面、智能的用户体验。在视觉业务方面,虹软致力于开发和应用大模型技术,以提高图像、视频等视觉信息处理的精确度和效率。这包括人脸识别、人体姿态识别、图像分割等多个领域,为用户提供更高水平的视觉智能解决方案。 虹软科技发布PhotoStudio® AI智能商拍摄影云工作室。虹软于2023年10月推出了全新产品——PhotoStudio® AI智能商拍摄影云工作室(Beta版)。该产品旨在为电商、团队和个人提供全方位的商业拍摄解决方案。PhotoStudio® AI的技术支持来自于虹软公司领先的视觉大模型、小模型(包括细分模型和浅层模型),以及多种计算机视觉(CV)和计算机图形学(CG)引擎所构建的ArcMuse计算技术引擎。这一产品的商业化将为有商业拍摄需求的用户提供卓越的AI拍摄体验,为其打造高效、智能的商业摄影解决方案。 Photostudio借助虹软先进的视觉技术,为客户提供更强大的图像处理功能。 图表2 PhotoStudio® AI PhotoStudio® AI商拍产品使用说明。在技术上,PhotoStudio® AI对边缘检测、人体几何、深度恢复和智能分割等领域的条件小型模型进行优化。目前,该工具支持处理真人图、人体图以及商品图,自动抠图后允许用户自定义模特和背景,通过AI自动创作生成的服装模特展示图和商品展示图。此外,还新增了一系列AI编辑功能,包括画质增强、美化、魔法擦除和智能补光等,以进一步提升图像处理的多样性和质量。 二、AI商拍产品体验:PhotoStudio AIVSWeShop 国内推出AI商拍产品,全民参与AI创作。WeShop是国内首个AI商拍产品,虹软科技也于2023年10月,推出PhotoStudio® AI智能商拍摄影云工作室。此次测试以两款软件为依托进行测试体验。 (一)进入界面 进入界面体验感对比:虹软科技PhotoStudio进入界面简洁,主要支持处理对象陈列简单,点击操作简便,一定程度上降低用户使用门槛;在工作界面支持提供样图进行测试,对初次使用者较为友好。Weshop界面较之专业性较强,自首页点击进入工作台模式。工作台展示了支持处理对象,该界面自定义功能点丰富、可选择的选项较多。WeShop不提供尝试样图,新用户在首次使用前需要进行一定程度的素材搜集以及程序了解。 图表3虹软科技PhotoStudio初始界面 图表4 WeShop初始界面 图表5虹软科技PhotoStudio工作台界面 图表6 WeShop工作台界面 (二)操作过程 1、真人图 真人图操作过程对比:虹软科技PhotoStudio操作简便,全部点击操作。用户上传图片后会进行自动抠图,进而可选择自定义模特及背景,一次可生成四张结果图,如有需要也可继续生成。Weshop较之专业性较强,用户上传图片后首先通过点击区域进行手动抠图,进而可使用文字描述、快捷模版等功能定义模特和背景。WeShop生成一张结果图。本次真人图试用中,两款软件生成结果图均良好。 图表7 PhotoStudio真人图 图表8 PhotoStudio真人图处理结果 图表9 WeShop真人图 图表10 WeShop真人图处理结果 2、人台图 人台图操作过程对比:虹软科技PhotoStudio在用户上传图片后会进行自动抠图,进而可选择自定义模特及背景。此次测试中选择的人台图在自动抠图后,扣图结果的手部与衣服的重叠处出现残缺,在AI处理后,生成结果自动填补了抠图缺陷,表现较好。Weshop在上传图片后通过点击区域进行手动抠图,操作选项同真人图,本次测试中使用快捷模版选项,自定义模特头像(正面)以及背景(人文建筑景点)。WeShop生成结果中模特均为背面并且没有生成腿部。考虑到测试图片不同可能带来的影响,后续我们采用同一张人台图在PhotoStudio中也进行了测试,与Weshop结果进行对比。 图表11 PhotoStudio人台图 图表12 PhotoStudio人台图处理结果 图表13 WeShop人台图处理结果 3、衣服图、商品图 衣服图、商品图操作过程对比:选择PhotoStudio“衣服图”模式,操作同上,生成结果表现良好;选择“商品版”模式可以为商品选择场景,添加要素、丰富要素等,要素的位置支持二次创作。WeShop无“衣服图”模式,选择“商品图”模式,快捷模版中可自定义地点,不支持模特的自定义,采用了文字描述“阳光型男”生成结果图时,结果图中模特细节有待改进。 图表14 PhotoStudio衣服图 图表15 PhotoStudio衣服图处理结果 图表16 PhotoStudio商品图预置场景 图表17 PhotoStudio商品图预置素材库 图表18 WeShop商品图试用 图表19 WeShop商品图处理结果 4、付费模式 AI商拍功能皆可免费尝试,后续增值付费使用服务略有不同。PhotoStudio给首次注册的新用户赠送200能量点(一次使用消耗40能量点),付费后根据不同的套餐提供AI编辑、专属客服、购买能量点打折、不等价值的能量点赠送等增值服务。WeShop给新用户赠送800算力(一次使用消耗40算力),付费后根据不同的套餐提供同时进行工程量提升、迭代产出次数提升、分辨率提升、购买加油包打折、不等价值的能量点赠送等增值服务。 图表20 PhotoStudio会员套餐服务(包月) 图表21 PhotoStudio会员套餐服务(包年) 图表22 WeShop会员套餐服务 图表23 PhotoStudio&WeShop不同套餐服务 (三)同一张人台图对比测试结果 人台图测试结果对比:虹软科技的四张图片均为正面,其中两张成功生成腿部,以此次测试的四张结果来说,成功率相对较高。WeShop四张生成结果中模特均为背面图,并且没有一张图片生成腿部,此次测试生成结果图的模特效果有待改进。 图表24两款软件测试用图 图表25 PhotoStudio人台测试结果图 图表26 WeShop人台测试结果图 (四)对比总结 本次试用的AI商拍产品功能点基本一致,但其成品表现存在差异。PhotoStudio功能操作简单,目前仅支持基础操作,本次试用中,真人图及衣服图生成结果图良好;同一人台图测试所得四张结果图成功率较高。WeShop操作较为专业,支持对象较多,部分功能需要对软件进行学习,在本次试用中,真人图生成结果图良好,商品图的生成结果图,模特效果细节有待改进;同一人台图测试所得四张结果图的模特效果有待改进。 图表27使用体验对比总结 三、投资建议与标的 多模态技术高速发展,文生图、文生视频能力未来可期,AI+绘图、AI+视频值得关注。 建议关注多模态应用和大模型基座相关标的:1)AI+绘图:万兴科技;2)AI+视频:当虹科技、虹软科技;3)大模型基座:科大讯飞。 四、风险提示 试用结果及总结仅为本次操作所得,或存在误差仅供参考,大模型研发不及预期,政策不及预期,行业竞争加剧。