PoseTrack数据集的构建基于MPII Human Pose数据集,通过选择包含多个动态活动人物的拥挤场景视频序列,并对其进行密集标注。具体步骤包括标注忽略区域以排除不可靠的姿态估计,标注头部边界框以估计人物的绝对尺度,并为每个人物分配唯一的跟踪ID。随后,对每个人物的姿态进行标注,涵盖15个身体部位。数据集最终包含550个视频序列,共计66,374帧,分为训练、验证和测试集,以支持多人物姿态估计和跟踪任务。
PoseTrack数据集由MPI for Informatics、University of Bonn、Amazon Research和Google Research等机构的研究人员共同创建,旨在解决视频中多人姿态估计与跟踪的难题。该数据集于2017年推出,核心研究问题是如何在复杂场景中实现多人姿态的准确估计与时间一致性跟踪。PoseTrack的推出填补了现有数据集在多人动态场景中的空白,为计算机视觉领域的研究提供了新的基准,推动了姿态估计与跟踪技术的发展。