您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[未知机构]:【财通计算机】CV领域再迎技术突破,通用视觉GPT曙光乍现[太阳 - 发现报告
当前位置:首页/会议纪要/报告详情/

【财通计算机】CV领域再迎技术突破,通用视觉GPT曙光乍现[太阳

2023-04-09未知机构陈***
【财通计算机】CV领域再迎技术突破,通用视觉GPT曙光乍现[太阳

【财通计算机】CV领域再迎技术突破,通用视觉GPT曙光乍现 [太阳]#Meta发布图像分割基础模型SAM。 Meta于4月5日发布的SegmentAnythingModel(SAM),是目前第一个专攻计算机视觉领域(CV)的图像分割任务的基础模型,由大约1100万张许可和隐私保护图像上收集的超过11亿个分割masks的数据集上训练而成(比现有数据集大400倍),它能很好地完成自动分割图像中的所有内容、根据提示词进行图像分割、能用交互式点和框的方式进行提示等任务。 此外,Meta还开源了SA-1B,这是迄今为止最大的图像分割数据集,为学术界和工业界日后的研究打下地基。 [太阳]#智源研究院推出通用分割模型SegGPT。 智源研究院联手浙江大学、清华大学于4月6日发布可利用视觉提示(prompt)完成任意分割任务的通用视觉模型SegGPT。与SAM类似,SegGPT具备通用能力、灵活推理能力、以及自动视频分割和追踪能力。 SegGPT的训练被定义为一个上下文着色问题,训练后,SegGPT可以通过上下文推理在图像或视频中执行任意分割任务,例如实例、类别、零部件、轮廓、文本等。 [太阳]#CV领域迎来GPT-3时刻。 SAM、SegGPT等模型的出现是对CV技术泛化能力的进一步突破,其通用性将显著拓宽图像识别的应用边界,并大幅降低相关技术的应用门槛。 我们认为在CV领域具备技术沉淀和客户渠道壁垒的公司将直接受益,此类公司有望率先利用最前沿的技术工具赋能下游行业,以供给创造需求&持续降本增效的方式巩固其先发优势。