Segment Anything Model

Segment Anything Model (SAM)：一种来自 Meta AI 的新 AI 模型，只需单击一下即可“切出”任何图像中的任何对象

SAM 使用多种输入提示

指定图像中要分割的内容的提示允许进行范围广泛的分割任务，而无需额外的培训。

可扩展输出

输出掩码可用作其他 AI 系统的输入。例如，可以在视频中跟踪对象遮罩、启用图像编辑应用程序、提升为 3D 或用于拼贴等创意任务。

零样本泛化

SAM 已经了解了物体是什么的一般概念——这种理解可以在不需要额外训练的情况下对不熟悉的物体和图像进行零样本泛化。

SAM 的数据引擎

SAM 的高级功能是其对通过使用模型在环“数据引擎”收集的数百万张图像和掩码进行训练的结果。研究人员使用 SAM 及其数据以交互方式注释图像并更新模型。这个循环重复多次以改进模型和数据集。

1100 万张图片，1B+ 掩码

在 SAM 的帮助下注释了足够多的蒙版后，我们能够利用 SAM 复杂的歧义感知设计来完全自动地注释新图像。为此，我们向 SAM 展示图像上的点网格，并要求 SAM 在每个点处分割所有内容。我们的最终数据集包括在约 1100 万个许可和隐私保护图像上收集的超过 11 亿个分割掩码。

高效灵活的模型设计

SAM 旨在高效地为其数据引擎提供动力。我们将模型解耦为 1) 一次性图像编码器和 2) 轻量级掩码解码器，可以在每次提示仅几毫秒内在网络浏览器中运行。

相关导航

Wonder Studio（奇迹工作室）

奇迹工作室:一种 AI 工具，可自动将 CG 角色动画、灯光和合成为真人场景

kinetix

在虚拟世界中表达自我,自定义表情可用于任何头像和多个世界，以创造性的方式表达您的个性。

Dimensions

Dimensions是一款人工智能软件，通过允许用户快速构建资产包来加速创意工作流。功能包括通过文本、图像参考或整个场景控制生成过程的能力、一致的360度纹理、数百个功能的快速发布以及协作功能。它是可靠的，易于...

Spline AI

Spline AI 是一种在使用 AI 的同时进行 3D 设计和协作的新方法。🔮创建对象/场景，📸动画，🏓添加物理，🕹️集思广益，🎨更改颜色/材料，🌈生成样式替代品等等。它还允许用户通过文本提示为 3D 对象生成无缝纹理，与队友...

Meshy|AI3D模型|文本转3D|图像转3D|AI纹理

Meshy是一个3D人工智能工具包，使用户能够轻松地将文本或2D图像转换为3D资产。用Meshy释放你的创造力-3D内容创作的未来。

Chaos

用实时光线追踪探索您的最复...

热门标签

SAM 使用多种输入提示

指定图像中要分割的内容的提示允许进行范围广泛的分割任务，而无需额外的培训。

可扩展输出

输出掩码可用作其他 AI 系统的输入。例如，可以在视频中跟踪对象遮罩、启用图像编辑应用程序、提升为 3D 或用于拼贴等创意任务。

零样本泛化

SAM 已经了解了物体是什么的一般概念——这种理解可以在不需要额外训练的情况下对不熟悉的物体和图像进行零样本泛化。

SAM 的数据引擎

SAM 的高级功能是其对通过使用模型在环“数据引擎”收集的数百万张图像和掩码进行训练的结果。研究人员使用 SAM 及其数据以交互方式注释图像并更新模型。这个循环重复多次以改进模型和数据集。

1100 万张图片，1B+ 掩码

高效灵活的模型设计

SAM 旨在高效地为其数据引擎提供动力。我们将模型解耦为 1) 一次性图像编码器和 2) 轻量级掩码解码器，可以在每次提示仅几毫秒内在网络浏览器中运行。

相关导航

热门网址

相关文章

Segment Anything Model

热门标签

SAM 使用多种输入提示

指定图像中要分割的内容的提示允许进行范围广泛的分割任务，而无需额外的培训。

可扩展输出

输出掩码可用作其他 AI 系统的输入。 例如，可以在视频中跟踪对象遮罩、启用图像编辑应用程序、提升 为 3D 或用于拼贴等创意任务。

零样本泛化

SAM 已经了解了物体是什么的一般概念——这种理解可以在不需要额外训练的情况下对不熟悉的物体和图像进行零样本泛化。

SAM 的数据引擎

SAM 的高级功能是其对通过使用模型在环“数据引擎”收集的数百万张图像和掩码进行训练的结果。 研究人员使用 SAM 及其数据以交互方式注释图像并更新模型。 这个循环重复多次以改进模型和数据集。

1100 万张图片，1B+ 掩码

高效灵活的模型设计

SAM 旨在高效地为其数据引擎提供动力。 我们将模型解耦为 1) 一次性图像编码器和 2) 轻量级掩码解码器，可以在每次提示仅几毫秒内在网络浏览器中运行。

相关导航

热门网址

相关文章

输出掩码可用作其他 AI 系统的输入。例如，可以在视频中跟踪对象遮罩、启用图像编辑应用程序、提升为 3D 或用于拼贴等创意任务。

SAM 的高级功能是其对通过使用模型在环“数据引擎”收集的数百万张图像和掩码进行训练的结果。研究人员使用 SAM 及其数据以交互方式注释图像并更新模型。这个循环重复多次以改进模型和数据集。

SAM 旨在高效地为其数据引擎提供动力。我们将模型解耦为 1) 一次性图像编码器和 2) 轻量级掩码解码器，可以在每次提示仅几毫秒内在网络浏览器中运行。