资源简介:
剑桥驾驶标签视频数据库 (CamVid) 是第一个带有对象类语义标签的视频集合,并带有元数据。该数据库提供了将每个像素与32个语义类之一相关联的地面真相标签。该数据库解决了对实验数据的需求,以定量评估新兴算法。虽然大多数视频都是使用固定位置的CCTV式摄像机拍摄的,但我们的数据是从驾驶汽车的角度捕获的。驾驶场景增加了观察对象类的数量和异质性。提供了超过十分钟的高质量30Hz素材,并在1Hz和部分15Hz处具有相应的语义标记图像。CamVid数据库提供了与对象分析研究人员相关的四个贡献。首先,手动指定超过700个图像的每像素语义分割,然后由第二个人检查并确认准确性。其次,对于那些对驾驶场景或自我运动感兴趣的人来说,数据库中的高质量和大分辨率彩色视频图像代表了有价值的延长持续时间的数字化素材。第三,我们拍摄了相机颜色响应和内在特征的校准序列,并为序列中的每一帧计算了3D相机姿态。最后,为了支持扩展此数据库或其他数据库,我们提供了定制的标签软件,以帮助希望为其他图像和视频绘制精确的类标签的用户。我们通过测量来自三个不同领域的算法的性能来评估数据库的相关性: 多类对象识别,行人检测和标签传播。
原始地址:
https://opendatalab.org.cn/OpenDataLab/CamVid