AI+3D模型

Segment Anything Model

Segment Anything Model (SAM):一种来自 Meta AI 的新 AI 模型,只需单击一下即可“切出”任何图像中的任何对象 SAM 使用多种输入提示 指定图像中要分割的内容的提示允许进行范围...

标签:
爱站权重:PC 百度权重移动 百度移动权重

Segment Anything Model (SAM):一种来自 Meta AI 的新 AI 模型,只需单击一下即可“切出”任何图像中的任何对象

SAM 使用多种输入提示

指定图像中要分割的内容的提示允许进行范围广泛的分割任务,而无需额外的培训。

可扩展输出

输出掩码可用作其他 AI 系统的输入。 例如,可以在视频中跟踪对象遮罩、启用图像编辑应用程序、提升 为 3D 或用于拼贴等创意任务。

零样本泛化

SAM 已经了解了物体是什么的一般概念——这种理解可以在不需要额外训练的情况下对不熟悉的物体和图像进行零样本泛化。

SAM 的数据引擎

SAM 的高级功能是其对通过使用模型在环“数据引擎”收集的数百万张图像和掩码进行训练的结果。 研究人员使用 SAM 及其数据以交互方式注释图像并更新模型。 这个循环重复多次以改进模型和数据集。

1100 万张图片,1B+ 掩码

在 SAM 的帮助下注释了足够多的蒙版后,我们能够利用 SAM 复杂的歧义感知设计来完全自动地注释新图像。 为此,我们向 SAM 展示图像上的点网格,并要求 SAM 在每个点处分割所有内容。 我们的最终数据集包括在约 1100 万个许可和隐私保护图像上收集的超过 11 亿个分割掩码。

高效灵活的模型设计

SAM 旨在高效地为其数据引擎提供动力。 我们将模型解耦为 1) 一次性图像编码器和 2) 轻量级掩码解码器,可以在每次提示仅几毫秒内在网络浏览器中运行。

相关导航

分享