数据集概述
本数据集是基于SUNRGBD图像数据集的空间指代表达式(REs)标注数据,用于定位图像中的目标对象。它是唯一使用RGB-D图像的RE数据集,平均空间介词数量更多,场景更杂乱。包含3个文件,无目录结构和数据拆分。
文件详解
- instances.json
- 文件格式:JSON
- 字段映射介绍:推测包含图像实例相关的标注信息,可能涉及目标对象的ID、位置及对应的指代表达式映射
- vocab.txt
- 文件格式:TXT
- 字段映射介绍:包含数据集使用的词汇表,预览内容显示有“tie”“man”“purple”“knife”等描述目标对象和属性的词汇
- refs(boulder).p
- 文件格式:.p(Python序列化文件)
- 字段映射介绍:推测包含指代表达式的具体标注数据,可能关联到特定图像实例的目标定位信息
数据来源
SUNRGBD图像数据集(https://rgbd.cs.princeton.edu/)
适用场景
- RGB-D图像目标定位研究: 用于开发和验证基于空间指代表达式的RGB-D图像目标定位算法
- 指代表达式模型训练: 为计算机视觉中处理空间描述的模型提供标注数据支持
- 场景复杂度分析: 利用更杂乱场景的特性,研究模型在复杂环境下的目标定位性能
- 空间语言理解研究: 分析数据中的空间介词使用,探索自然语言与图像空间信息的关联机制