
以下是对文本的润色和编辑:
第四届真实世界像素级视频理解挑战赛(The 4th PVUW Challenge)
主页/论文征集:https://pvuw.github.io/
赛道 1:复杂场景视频目标分割挑战赛(MOSE Challenge):
参赛及数据集下载:https://codalab.lisn.upsaclay.fr/competitions/21948
赛道 2:基于动作描述的指向性视频分割挑战赛(MeViS Challenge):
参赛及数据集下载:https://codalab.lisn.upsaclay.fr/competitions/21944
大赛简介
第四届真实世界像素级视频理解(Pixel-level Video Understanding in the Wild, PVUW)挑战赛将于 CVPR 2025 期间在美国田纳西州纳什维尔的 Music City Center 举行。像素级场景理解是计算机视觉领域中的一项核心任务,旨在识别图像中每个像素的类别、掩码和语义信息。然而,现实世界是动态且基于视频的,而非静态的图像状态,因此,学习进行视频分割对于实际应用而言更具合理性和实用性。为了推动从图像分割向视频分割的升级,本次研讨会(workshop)将发布全新的数据集和竞赛,目标是在具有挑战性且极具应用价值的开放世界场景下实现像素级视频理解。
本次挑战赛设置了两个赛道:复杂场景视频目标分割赛道(MOSE Track)和基于动作描述的指向性视频分割挑战赛(MeViS Track)。主办方为这两个挑战赛分别采集了当前最大规模的复杂场景视频目标分割数据集 Complex Video Object Segmentation (MOSE) [1] 和基于动作描述的视频分割数据集 Motion Expression Video Segmentation (MeViS) [2]。这两个数据集均针对各自任务中亟待解决的问题,包含大量高难度且贴近现实的样本,对视频理解机器学习方法提出了严峻的挑战。
除挑战赛之外,本次研讨会还将涵盖以下研究主题,并诚邀相关论文投稿:
- 图像/视频的语义与全景分割
- 交互式图像/视频理解与分割(如基于文本、点击等)
- 视频对象/实例分割
- 复杂环境下的视频理解
- 语言引导的视频理解
- 音频引导的视频分割
- 视频场景解析的高效计算方法
- 视频中的半监督识别
- 评估视频场景解析质量的新指标
- 真实世界的视频应用(如自动驾驶、室内机器人、视觉导航等)
目前,两个挑战赛的数据集均已开放下载,测试提交入口也已开放,欢迎参赛者自由测试各种方法!
赛道 1:复杂场景视频目标分割(MOSE)
MOSE(复杂场景视频目标分割)专注于复杂环境下的视频目标分割问题,旨在推动该领域的研究与应用。本次大赛聚焦于配套的 MOSE 数据集 [1],该大规模数据集包含 2149 个视频片段和 5200 个目标,共计 431,725 个高质量的目标分割掩码。视频分辨率为 1920×1080,视频长度从 5 秒到 60 秒不等。MOSE 数据集的显著特点是其复杂的场景,包括目标的消失与重现、不显眼的小物体、严重的遮挡以及拥挤的环境等。与上一届比赛相比,本届比赛的测试数据将加入全新的场景,提供更加丰富且更具挑战性的数据。
数据集主页:https://henghuiding.github.io/MOSE/
参赛网站:https://codalab.lisn.upsaclay.fr/competitions/21948
数据集下载:https://codalab.lisn.upsaclay.fr/competitions/21948#participate
数据集 API 代码:https://github.com/henghuiding/MOSE-api
赛道 2:基于动作描述的指向性视频分割(MeViS)
MeViS(基于动作描述的指向性视频分割)赛道也将于 CVPR 2025 同期举行。本次挑战赛的重点是基于动作描述的指向性视频分割,即根据描述物体运动的句子来识别并分割视频内容中的目标物体。MeViS 数据集 [2] 是本次比赛的重要组成部分,包含 2006 个视频片段和 443,000 个高质量的目标分割掩码,共计 28,570 句描述 8,171 个复杂环境下物体运动的句子。在本届赛事中,MeViS 赛道也会加入更具挑战性的全新场景和视频类别。
数据集主页:https://henghuiding.github.io/MeViS/
参赛网站:https://codalab.lisn.upsaclay.fr/competitions/21944
数据集下载:https://codalab.lisn.upsaclay.fr/competitions/21944#participate
Baseline 代码:https://github.com/henghuiding/MeViS
参赛信息
两个挑战赛均在 CodaLab 平台上举办。参赛者可以将数据集下载至本地,训练测试后将结果提交至赛事平台进行评估。目前,两个挑战赛的数据集均已开放下载,验证集提交入口也已开放,欢迎个人和团队自由测试各种方法。
测试集提交入口开放时间为 3 月 15 日至 3 月 25 日。最终比赛结果将于 3 月 27 日公布,两个挑战赛的冠军都将被邀请在 CVPR 2025 研讨会上分享展示。
研讨会论文提交入口即将开放,请关注官方网站获取地址:https://pvuw.github.io/