行业研究公司研究宏观策略财报招股书会议纪要海南封关低空经济 DeepSeek AIGC 大模型

计算机行业点评报告：Meta发布SAM模型，视觉CV迎来重大变化

信息技术2023-04-10开源证券笑***

AI智能总结

Meta于2023年4月发布了首个基础图像分割模型SAM（Segment Anything Model）及其对应数据库SA-1B。SAM是一个通用场景的图像分割模型，它创新地引入了自然语言处理（NLP）领域的prompt范式，允许用户通过合理的指令即可完成图像分割任务，无需额外训练，实现了“开箱即用”。

SAM的训练基于SA-1B数据库，该数据库包含1100万张高分辨率图像和11亿个高质量分割掩码，其数量分别是现有数据集的6倍和400倍，平均分辨率达到1500×2250像素，能够精细到门把手级别，是目前最大的分割数据集。

SAM的应用范围广泛，适用于任何需要图像识别与分割的任务，如增强AR/VR体验、内容创作、视频编辑等。在AR/VR领域，SAM能帮助提升用户体验，使用户关注的对象升维为3D。对于内容创作者，SAM能简化图像处理流程，提高工作效率。

SAM的分割能力显著提升，被视为计算机视觉领域的突破性进展，有望降低计算机识别的门槛。SAM旨在构建一套通用的图像分割基础模型，减少特定场景下的建模知识、训练计算和数据标记需求，使其能够在统一框架下完成图像分割任务。Meta已将SAM模型和SA-1B数据库开源，未来预计将显著降低计算机识别的门槛。

鉴于SAM的潜力及其对计算机视觉（CV）领域的推动作用，投资者看好在CV领域拥有技术积累和应用场景的公司。这些公司包括但不限于从事图像识别的云从科技、千方科技、格灵深瞳、虹软科技、海康威视、大华股份，从事遥感卫星业务的航天宏图和中科星图，以及涉及自动驾驶的中科创达、四维图新、光庭信息、东软集团等。然而，需要注意的是，技术发展、商业落地和政策支持可能存在不确定性，应持续关注相关风险。

Meta发布首个基础图像分割模型SAM （1）SAM概况：2023年4月，Meta发布CV模型SAM（即Segment Anything Model），以及对应的数据库SA-1B。SAM是面向通用场景的图像分割模型，并且引入NLP领域的prompt范式，用户通过合理的prompt即可完成图像分割任务，无需额外训练实现“开箱即用”。（2）SAM训练方法：SAM由SA-1B数据库训练而来，SAM通过人工交互式分割后（先训练再人工注释），再用注释后的数据更新SAM，多次重复循环，不断优化模型和数据集。SA-1B（1 Billion）数据库包括1100万张高分辨率的图像以及11亿个高质量的分割掩码（masks），图像数量和masks数量分别是现有数据集的6倍和400倍，图片平均分辨率达1500×2250，颗粒度可以达到门把手级别，是目前最大的分割数据集。（3）SAM应用场景：SAM可用于任何需要对图像进行识别和分割的场景，基于prompt工程，可以成为内容创作、AR/VR、科学领域或通用AI系统的组件，实现多模态处理。比如在AR/VR领域，SAM可以把用户注视的对象升维至3D；对于内容创作者，SAM可以提取图像用于拼贴或视频剪辑。 SAM分割能力大幅提升，有望降低计算机识别门槛（1）SAM分割能力大幅提升。CV模型的核心任务是图像识别，难点在于图像可以无限细分、逻辑关系复杂，识别的颗粒度和准确性存在冲突。SAM目前对于未知和模棱两可的场景也能实现较好的图像分割效果。英伟达AI科学家Jim Fan表示“SAM是计算机视觉领域的GPT-3时刻”。（2）有望降低计算机识别门槛。图像分割是计算机视觉的基础技术之一，由于图像的复杂性，面对不同场景需要设计不同的图像分割模型。SAM的目标在于建立一套图像分割基础模型，降低对于特定场景建模知识、训练计算、数据标记的需求，有望在统一框架下完成图像分割任务。Meta表示将SAM模型和SA-1B数据库开源，未来有望作为基础模型，大幅降低计算机识别门槛。投资建议：看好在CV领域具备技术储备和应用场景的公司 CV技术在自动驾驶（物体检测、车道标记、信号识别等）、面部识别（安防、支付等）、医疗、制造、遥感等场景有广阔应用前景，根据福布斯数据，2022年计算机视觉和硬件市场规模达486亿美元。我们认为，SAM大幅降低计算机识别门槛，CV通用场景应用有望加速推广，多模态技术的应用也有望进一步提速，看好在CV领域具备技术储备和应用场景的公司：（1）图像识别领域，受益标的云从科技、千方科技、格灵深瞳、虹软科技、海康威视、大华股份等；（2）遥感卫星领域，受益标的航天宏图，中科星图等；（3）自动驾驶领域，受益标的中科创达、四维图新、光庭信息、东软集团等。风险提示：技术发展不及预期；商业落地不及预期；政策支持不及预期。

点击免费查看完整报告

你可能感兴趣

计算机行业点评报告：Meta发布SAM模型，视觉CV迎来重大变化

你可能感兴趣

Meta发布SAM模型，CV领域迎来新突破

计算机：Meta推出SAM模型，机器视觉里程碑

Meta新模型SAM推动CV领域的GPT3时刻到来，重点推荐关注MR生态链公司！

计算机行业：Meta发布Sapiens视觉模型，落地场景广阔

AIGC行业快评：Meta发布视觉大模型SAM，持续看好内容与应用产业机遇