品玩7月30日讯,Meta 今天宣布,发布全新开源模型Meta SAM 2,并将其分割能力扩展到了视频领域。
SAM 2 可以分割图像或视频中的任何对象,并在视频的所有帧中实时一致地跟踪该对象。现有模型无法实现这一功能,因为视频中的分割比图像中的分割更具挑战性。在视频中,物体会快速移动,外观会发生变化,还会被其他物体或场景部分遮挡。我们在构建 SAM 2 时解决了其中的许多难题。SAM 2 还可用于跟踪视频中的目标对象,以帮助更快地标注视觉数据,用于训练计算机视觉系统,包括自动驾驶汽车中使用的系统。它还能以创造性地方式,在实时或实时视频中选择对象并与之互动。
该项技术现已开源,以便其他人能够探索新的功能和用例。
0 条评论
请「登录」后评论