您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[华创证券]:AI+专题系列点评(四):美图公司多模态AI应用点评 - 发现报告
当前位置:首页/行业研究/报告详情/

AI+专题系列点评(四):美图公司多模态AI应用点评

信息技术2024-01-24吴鸣远华创证券七***
AI智能总结
查看更多
AI+专题系列点评(四):美图公司多模态AI应用点评

多模态推动AIGC多元化。基于多模态的学习和推理被认为是未来人工智能发展的趋势,通过大规模数据的学习训练,AI获取多领域知识,能够完成大量流程化的任务。美图公司在推动影像生产力工具的普及化方面取得进展,计划持续推动AIGC创新,为用户的生活带来更多乐趣。同时,美图公司发布了MiracleVision 3.0和4.0版本的AI视觉大模型,广泛应用于不同行业,包括电商、广告、游戏、动漫和影视,为用户提供更丰富的体验。 美图公司将视觉大模型应用于多场景,致力于推动美学思想与社会经济的增长。公司旗下产品涵盖多个领域,包括AI视觉创作工具WHEE、专业视频人像精修工具WinkStudio、以及主打AI商业设计的美图设计室和AI数字人生成工具DreamAvatar。这些工具提供一站式的AI视觉创作服务,助力电商、视频制作等行业降低成本。美图公司采用底层+中间层+应用层的商业模式,以技术驱动付费,不断完善AIGC功能体系,迅速增长VIP用户数。作为以美和人工智能为核心的科技公司,美图凭借稳定的用户群体和品牌公信力,通过不断推出新产品,致力于扩大市场占有率。 美图提供多个AI应用层产品。WHEE为AI图片应用层的主导产品,注重用户上传素材创作风格选择;Wink系列主导AI视频应用层,分为移动端和桌面端,分别提供简单编辑和专业调整;美图设计室致力于为商家提供低成本的设计产品;DreamAvatar在AI数字人应用层将真人替换为数字人;而美图秀秀则整合多种功能,通过简单易用的移动端推广AI创作。 投资建议与标的:多模态技术高速发展,文生图、文生视频能力未来可期,AI+绘图、AI+视频值得关注。建议关注多模态应用和大模型基座相关标的: 1)AI+绘图:万兴科技、美图公司;2)AI+视频:当虹科技、虹软科技; 3)大模型基座:科大讯飞。 风险提示:测试结果及结论为本次操作所得,或存在误差仅供参考、大模型研发不及预期、政策不及预期、行业竞争加剧。 一、美图大模型 多模态推动AIGC内容多元化,使得AIGC具有更通用和更强的基础能力。基于多模态的学习和推理,是未来人工智能的大势所趋。通过大规模数据的学习训练,AI具备了多个不同领域的知识,可以完成大量可流程化的工作。美图公司相关负责人表示,目前AIGC正推动影像生产力工具的普及化,后续美图公司将持续推动AIGC创新,助力AIGC从“助手角色”走向“伙伴角色”甚至是“艺术家角色”,最终为美图用户的生活增光添彩。 美图抓住应用场景的核心需求,推出离用户更近的视觉大模型。2023年10月,美图公司发布自研AI视觉大模型MiracleVision(奇想智能)3.0版本。目前,美图AI视觉大模型MiracleVision3.0已全面应用于美图旗下影像与设计产品,并将助力电商、广告、游戏、动漫、影视五大行业。2023年12月,美图公司发布自研AI视觉大模型MiracleVision(奇想智能)4.0版本,主打AI设计与AI视频。MiracleVision4.0将于2024年1月陆续上线至美图旗下产品,届时用户可在美图秀秀、美颜相机、Wink、美图设计室、WHEE等产品中体验。 视觉大模型的成熟发展,致力于引领美学思想与社会经济增长。目前,美图公司旗下产品已上线多款功能。AI视觉创作工具WHEE提供了多款AI绘画工具,提供一站式AI视觉创作服务。专业视频人像精修工具WinkStudio提供专业的视频美化能力,实现优质的人像处理。主打AI商业设计的美图设计室通过AI商品图、AI海报和AI模特试衣等功能助力电商卖家降低成本。AI数字人生成工具DreamAvatar一键替换真人的AI演员功能帮助用户轻松创建CG视频。美图秀秀上线“美图AI”频道,为用户提供一站式AIGC创作方式和内容生产工具。 图表1主要产品介绍 美图运用AIGC技术作为底层大模型,AI技术强化驱动付费。随着美图AIGC功能体系的不断完善,美图公司VIP用户数快速增长。美图公司采用底层+中间层+应用层的商业模式,作为一家以美为内核,以人工智能为驱动的科技公司,拥有稳定的用户群体以及品牌公信力。随着技术的不断进步,推出新的产品,不断扩大公司的市场占有率。 图表2美图AI产品生态 二、功能展示 1、AI图片层 AI图片应用层以WHEE为主导产品,支持用户自定义风格及素材创作。美图WHEE的定位是AI视觉创作的灵感激发器,其设计理念更加贴近专业设计师的需求,可以为创作者提供更多的想象力和灵感。WHEE主要提供集合了图生图、文生图、风格训练模型、局部修改及画面拓展等的AI绘图功能。 图生图功能输入图片素材,选择绘图风格即可生成新的作品。美图WHEE生成图像的张数可以在1~4张之间选择,生成4张图像大约需要1分钟左右。图生图功能需要上传原图,奠定整体风格基调,再根据所添加提示词,对原有图片进行修改。 图表3图生图功能 文生图功能输入提示词组合,一键即可完成快速生图。文生图功能的核心是对于创意内容的描述,需要用简明词语组合对所展示的创意进行描述,WHEE能够通过增加括号的形式增加括号内提示词权重。WHEE是一个文生图功能,它能够根据用户提供的简明词语组合生成图片。如果用户想要强调某个关键词或者描述词,可以通过增加括号的形式来增加其权重。这样,WHEE在生成图片时会更加注重这些关键词或描述词的呈现。简单来说,增加括号是一种强调特定关键词或描述词的方法,以使WHEE生成更符合用户需求的图片。 图表4文生图功能 WHEE作为AI图片应用层的主要软件,向其他美图旗下应用提供了多种功能。AI生成图片的步骤大致相同,即用户进入美图AI创作工具后,输入图片内容及需求描述,设置绘图风格模型后生成创意绘画。其中风格训练模型功能随着用户的不断描述补充可生成定制化风格,并可将风格应用于其他功能中。 图表5AI图片应用层其他功能 2、AI视频层 AI视频应用层以Wink系列产品为主导,提高创作效率且具备专业的画面渲染能力。 Wink系列主要分为桌面端WinkStudio以及移动端Wink,旨在提供差异化的服务。 Wink移动端可以进行简单的视频编辑并快速生成作品,移动端主要支持美颜、画质修复及剪辑。WinkStudio桌面端则更加专业,在移动端的基础上支持AI动漫、智能水印消除、智能抠像等高阶操作,大幅提高生产效率。 Wink系列主要定位为视频剪辑和美容,其亮度功能为AI动漫及AI调色。Wink系列提供专业视频人像精修体验,在此基础上其功能亮点是AI动漫视频生成。用户只需要在功能内导入视频,选择不同的动态模板,就可以生成多元化的效果图,实现低成本真人视频动漫化。AI动漫不断推出新的动态模板,例如建模脸、Idol、彩墨等风格,较大程度的还原了主体的面部比例,流畅度较高。 图表6AI动漫效果图 图表7AI动漫动态模板 3、AI设计层 AI设计应用层推出美图设计室,打造设计工具集解决用户设计需求。美图设计室解决用户从图片设计,到产品设计,再到产品宣传的设计需求。美图设计室围绕“AI商品设计”与“AI平面设计”两大板块,推出AI商品图、AI模特试衣和AI Logo等主要功能,迈出了AI与产业创新融合的新一步。美图设计室的多款AI设计功能节省成本,提高效率。 AI商品图功能上传商品素材图,即可AI生成贴近产品的多场景。上传素材图后,该功能自动进行图像主体AI抠图,用户可使用推荐场景也可自定义描述场景或添加背景参考图,一次生成四张商品图。 图表8AI商品图功能 AI Logo设计功能,支持用户自定义内容及风格。用户输入Logo名称、副标题或口号、Logo描述和风格,即可AI生成作品。用户可使用功能内推荐风格也可自定义参考图型,AI根据上传图片的形状、轮廓进行创作。一次可生成9张设计图。 图表9AI Logo设计功能 AI商品设计功能适用对象广泛,支持自定义商品。AI商品设计功能可设计潮鞋、服装、箱包且可自定义商品。用户只需添加一张线稿及一句描述就能零成本获得大量可视化效果图。该功能可使用参考图库并选择材质描述,也可使用风格迁移,AI将模仿图片的配色、视觉风格、画面元素。一次生成8份设计。 图表10AI商品设计功能 AI海报功能输入文字及图片素材,即可一键生成宣传海报。该功能提供七种海报类型,包括电商主图、日常问候、活动邀请函、生日祝福、节日祝福、公告通知和人才招聘,不同海报类型可输入对应文字、图片及二维码,便可生成设计。后续支持二次修改,最多可生成十张。 图表11AI海报功能 AI商拍功能支持人台图、真人图或服装图生成,支持模特风格自定义。该功能根据性别、人种、肤色进行模特分类,用户可进行自定义选择。根据上传的人台图、真人图或服装图及模特选择,可以生成不同人种、年龄和风格的模特上身图。本次试用,服装在模特身上贴合较好,可自定义多种模特风格。AI模特制作过程高效,成本相对低廉。 图表12AI模特试衣 4、AI数字人 AI数字人应用层推出DreamAvatar,支持数字人生成与匹配。DreamAvatar以AI演员为主功能,可在导入的视频素材中制定人物,把真人替换为数字人。用户可以选择不同风格的数字人形象,将想象变为现实。AI演员与真人动作同步、与场景匹配。 图表13AI演员功能效果图 美图秀秀作为AI影像服务聚合产品,整合集成相关AI功能。美图秀秀将美图旗下的相关功能聚集起来,可大大提高用户创作设计的效率。美图秀秀主要包含AI写真、AI绘画、AI动漫、AI简笔画、AI消除、AI滤镜、AI移除和AI建模脸等功能。通过多流程协同创作,用户可以获得视频、图片及文字的多维度作品。美图秀秀移动端简单易上手,可将AI创作普及化。 美图秀秀AI功能简单易上手,推动广泛使用及传播。AI写真功能由美颜相机提供,输入8-20张自拍照后建立面部档案,可选择多款写真功能;AI绘图服务由WHEE提供; AI动漫功能由Wink提供,可选择风格,一键变动漫;AI简笔画功能可以将随手的涂鸦作品AI生成各种风格图画;AI消除功能由美图设计室提供,可使用涂抹消除、款选消除和圈选消除对画面中的元素进行精准删除;AI滤镜功能由美图设计室提供,可将上传的目标图的色彩效果转移到作品中。 图表14美图秀秀主要功能效果图 三、投资建议与标的 多模态技术高速发展,文生图、文生视频能力未来可期,AI+绘图、AI+视频值得关注。 建议关注多模态应用和大模型基座相关标的:1)AI+绘图:万兴科技;2)AI+视频:当虹科技、虹软科技;3)大模型基座:科大讯飞。 四、风险提示 测试结果及结论为本次操作所得,或存在误差仅供参考、大模型研发不及预期、政策不及预期、行业竞争加剧。