您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国信证券]:AIGC行业快评:Meta发布视觉大模型SAM,持续看好内容与应用产业机遇 - 发现报告
当前位置:首页/行业研究/报告详情/

AIGC行业快评:Meta发布视觉大模型SAM,持续看好内容与应用产业机遇

信息技术2023-04-12张衡国信证券后***
AIGC行业快评:Meta发布视觉大模型SAM,持续看好内容与应用产业机遇

请务必阅读正文之后的免责声明及其项下所有内容证券研究报告|2023年04月12日超配1AIGC行业快评Meta发布视觉大模型SAM,持续看好内容与应用产业机遇公司研究·公司快评传媒投资评级:超配(维持评级)证券分析师:张衡021-60875160zhangheng2@guosen.com.cn执证编码:S0980517060002事项:4月5日,Meta发布机器视觉领域首个用于图像分割的通用大模型SegmentAnythingModel(SAM)及其训练数据集SegmentAnything1-Billion(SA-1B),并将该模型及数据集在GitHub上开源,以促进机器视觉通用基础大模型的进一步研究。国信传媒观点:1)SAM是计算机视觉领域发布第一个用于图像分割的、可通过提示(prompt)方式应用的通用大模型,类似自然语言领域(NLP)中的大模型ChatGPT;2)从模型框架上看,该模型和NLP领域大模型一样采用Transformer架构,该模型及其数据集开源发布将会大幅促进机器视觉通用基础大模型的进一步研究。SAM可以与NLP方向的大模型一同成为更大AI系统的组成部分,理解网页的视觉和文本内容,并对世界进行多模态的理解与生成;3)从应用场景上来看,SAM可用于帮助需要在任何图像中查找和分割对象的众多领域中的应用程序;对于内容创作者,SAM可以改进创意应用,例如提取图像区域以进行拼贴或视频编辑;在AR/VR领域,SAM可以根据用户的视线选择对象,然后将其“提升”为3D等等;我们认为,从ChatGPT到SAM、从文本到视觉,大模型技术有望实现从单一模态到多模态的加速推进。从文本生成到图像、视频、游戏、VR/AR内容及平台有望迎来基于新科技“降本增效”所带来的奇点时刻,IP、内容(影视、游戏、文学等)、数据资源价值有望持续重估放大:1)持续推荐AIGC时代具备稀缺性或者价值放大可能的关键产业链环节,推荐大模型、IP、数据要素及稀缺场景,大模型推荐昆仑万维,IP推荐中文在线、视觉中国、上海电影、汤姆猫、奥飞娱乐、华策影视、光线传媒等标的,数据要素推荐浙数文化、中国科传、新华网、人民网以及出版板块,场景落地关注AI+文学、音乐、数字人、营销服务、电商、视频、游戏等领域;2)持续看好估值处于合理区间的游戏板块(推荐恺英网络、姚记科技、三七互娱、吉比特、世纪华通等标的)以及广告/影视产业链个股(芒果超媒、光线传媒、哔哩哔哩等标的)。风险提示:监管政策风险;业绩风险;商誉及资产减值风险等。评论:Meta发布并开源图像分割基础大模型SAM4月5日,Meta发布机器视觉领域首个用于图像分割的通用大模型SegmentAnythingModel(SAM)及其训练数据集SegmentAnything1-Billion(SA-1B),并将该模型及数据集在GitHub上开源,以促进机器视觉通用基础大模型的进一步研究。图1:MetaAI发布 请务必阅读正文之后的免责声明及其项下所有内容证券研究报告2资料来源:MetaAI,国信证券经济研究所整理SAM是机器视觉领域第一个基础大模型,泛化通用能力大幅增强。识别图片中哪些像素属于同一个物体是计算机视觉(CV)的一个核心问题,相关技术被广泛应用在从科学研究、自动驾驶和图片编辑等各种领域。从机器视觉领域模型来看,过往机器视觉领域模型大部分为特定任务构建,需要技术专家进行高度专业化工作,和大量特定任务领域内的标注数据。SAM是计算机视觉领域发布第一个用于图像分割的、可通过提示(prompt)方式应用的通用大模型,与自然语言领域(NLP)中的大模型ChatGPT类似。从图形分割方式来看,过往解决图像中物体分割主要有两类方法:1)交互式分割,可分割任何类别的对象,但需要人不断迭代细化掩码来引导分割;2)自动分割,可分割图像中提前定义、训练好的特定对象类别,譬如可分割图片中的猫这一物体类别,但在实现这种自动分割前需要先通过监督式机器学习的方法训练出一个能够识别猫的模型,而一个仅能识别猫的模型仍需要数千甚至数万手动标注好分割猫的训练集作为数据来训练该模型。这两种方法都没有提供通用的全自动的分割方法。SAM将以上两种方式相结合,可以通过单一模型和可提示的(Promptable)界面以灵活的方式完成广泛的分割任务。同时SAM在包含10亿个掩码的多样化、高质量数据集上训练,使其能够泛化到新类型的类型和图像,从业者将不再需要收集他们自己的细分数据并为他们的用例微调模型。从SAM目前所具备的能力来看,根据Meta披露的信息,SAM已经学会了关于物体的一般概念,可以为任何图像或者视频中的对象生成掩码(mask),甚至包括它在训练期间没有遇到的对象和图像类型,SAM的通用性可以涵盖广泛的用例,即使应用在新的图像领域,譬如水下照片和细胞显微镜,也不需额外训练,实现了零样本迁移能力,泛化通用能力大幅增强。图2:SAM分割图像前的厨房照片图3:SAM能够准确分割厨房图片中的每样物体 请务必阅读正文之后的免责声明及其项下所有内容证券研究报告3资料来源:MetaAI,国信证券经济研究所整理资料来源:MetaAI,国信证券经济研究所整理图4:SAM分割图像前的水下照片图5:SAM能够准确分割水下图像的每个生物资料来源:MetaAI,国信证券经济研究所整理资料来源:MetaAI,国信证券经济研究所整理Prompt范式延展到机器视觉领域,图像分割交互应用方式灵活。受自然语言处理中prompt方式启发,SAM也采用prompt的交互方式。当前SAM的prompt交互方式主要有4种:1)用户通过单击或交互式单击点来选定需要分割的物体;2)SAM可自动分割图像中所有物体;3)SAM可通过用户输入提示词分割图像中物体;4)SAM可通过用户随意画框分割框内包含的物体。同时SAM在面对可分割对象歧义时能够输出多个有效掩码,这项能力能够灵活助力解决现实世界中可能面临的问题。图6:用户通过单击或单击点选定分割物体图7:SAM自动分割图像中所有物体 请务必阅读正文之后的免责声明及其项下所有内容证券研究报告4资料来源:MetaAI,国信证券经济研究所整理资料来源:MetaAI,国信证券经济研究所整理图8:SAM通过用户输入提示词分割图像中物体图9:SAM通过用户随意画框分割框内出现物体资料来源:MetaAI,国信证券经济研究所整理资料来源:MetaAI,国信证券经济研究所整理图10:SAM在面对可分割对象歧义时能够输出多个有效掩码资料来源:MetaAI,国信证券经济研究所整理机器视觉基础大模型及其训练数据集开源发布,多模态AI发展或更进一步。MetaAI发布机器视觉领域首个用于图像分割的通用大模型SegmentAnythingModel(SAM)及其训练数据集SegmentAnything1-Billion(SA-1B),并将该模型及数据集在GitHub上开源。从模型框架上看,该模型和NLP领域大模型一样采用 请务必阅读正文之后的免责声明及其项下所有内容证券研究报告5Transformer架构。SAM采用256块英伟达A100GPU训练3-5天完成。对于AI研究社区来说,该模型及其数据集开源发布将会大幅促进机器视觉通用基础大模型的进一步研究。SAM可以与NLP方向的大模型一同成为更大AI系统的组成部分,理解网页的视觉和文本内容,并对世界进行多模态的理解。图11:SAM模型架构资料来源:MetaAI,国信证券经济研究所整理SAM模型未来应用前景广泛。SAM可能的应用场景包括:1)SAM可用于帮助需要在任何图像中查找和分割对象的众多领域中的应用程序;2)对于内容创作者,SAM可以改进创意应用,例如提取图像区域以进行拼贴或视频编辑;3)在科学领域,SAM可用于对自燃事件进行科学研究;4)在AR/VR领域,SAM可以根据用户的视线选择对象,然后将其“提升”为3D;等等。图12:在AR/VR中SAM可以根据用户视线选择对象图13:SAM可将图像中物体提升为“3D”用于创意任务资料来源:MetaAI,国信证券经济研究所整理资料来源:MetaAI,国信证券经济研究所整理投资建议:从生产力到商业化应用,基于科技及产业视角聚焦传媒互联网关键环节核心标的从ChatGPT到SAM、从文本到视觉,大模型技术有望实现从单一模态到多模态的加速推进。从文本生成到图像、视频、游戏、VR/AR内容及平台有望迎来基于新科技“降本增效”所带来的奇点时刻,IP、内容(影视、游戏、文学等)、数据资源价值有望持续重估放大:1)持续推荐AIGC时代具备稀缺性或者价值放大可能的关键产业链环节,推荐大模型、IP、数据要素及稀缺场景,大模型推荐昆仑万维,IP推荐中文在线、 请务必阅读正文之后的免责声明及其项下所有内容证券研究报告6视觉中国、上海电影、汤姆猫、奥飞娱乐、华策影视、光线传媒等标的,数据要素推荐浙数文化、中国科传、新华网、人民网以及出版板块,场景落地关注AI+文学、音乐、数字人、营销服务、电商、视频、游戏等领域;2)持续看好估值处于合理区间的游戏板块(推荐恺英网络、姚记科技、三七互娱、吉比特、世纪华通等标的)以及广告/影视产业链个股(芒果超媒、光线传媒、哔哩哔哩等标的)。表1:重点公司盈余预测与评级公司公司投资昨收盘总市值EPSPE代码名称评级(元)(亿元)20212022E2023E20212022E2023E300788.SZ中信出版增持27.93531.270.661.26224222603096.SH新经典增持22.96370.81.091.37292117603999.SH读者传媒增持6.57380.150.190.22443530002292.SZ奥飞娱乐增持6.96103-0.280.010.1-2557270002739.SZ万达电影增持14.493160.05-0.690.48297-2130300133.SZ华策影视买入8.461610.210.230.28403631300251.SZ光线传媒买入9.36275-0.110.060.31-8815730600977.SH中国电影增持13.992610.13-0.120.51110-11827002291.SZ遥望科技买入15.58142-0.770.621.03-202515300058.SZ蓝色光标增持10.012490.210.090.214811347600556.SH天下秀增持9.251670.20.160.23475941600986.SH浙文互联增持6.89910.220.060.193112536605168.SH三人行增持156.581594.987.219.96312216002027.SZ分众传媒买入6.739720.420.210.32163121301102.SZ兆讯传媒买入38.34771.61.121.8243421002517.SZ恺英网络增持12.962790.270.450.57482923002555.SZ三七互娱买入30.876851.31.351.59242319002602.SZ世纪华通增持6.454810.310.20.23213228002605.SZ姚记科技增持28.971191.40.841.46213520002624.SZ完美世界增持18.63610.190.971.08981917300031.SZ宝通科技增持22.6930.98-0.731.0223-3122300113.SZ顺网科技增持16.431140.09-0.230.16186-71102300418.SZ昆仑万维增持50.656021.30.981.1395246300459.SZ汤姆猫增持8.623030.20.170.2435143603444.SH吉比特买入523.9937720.4320.3323.04262623000681.SZ视觉中国买入17.521230.220.210.33808553300413.SZ芒果超媒买入41.87821.131.381.64373026603533.