视觉语言导航优先级地图数据集

数据集概述

该数据集包含支持视觉语言导航优先级地图(PM-VLN)模块研究的相关数据,涵盖两个辅助任务数据集:TR-NY-PIT-central(城市路径轨迹集)与MC-10(多模态地标样本集),还提供曼哈顿路径轨迹及Touchdown任务语言标记数据,用于模型训练与评估。

文件详解

  • 文件名称:datasets_details.pdf
  • 文件格式:PDF
  • 内容:可能包含数据集的详细说明文档,介绍数据集结构、变量定义、使用方法等背景信息
  • 文件名称:datasets_pm_vln.tar.gz
  • 文件格式:压缩包(.tar.gz)
  • 内容:可能包含数据集的核心数据文件,如TR-NY-PIT-central路径轨迹数据、MC-10多模态地标样本数据、曼哈顿路径轨迹数据及Touchdown任务语言标记数据等

适用场景

  • 视觉语言导航模型研究:用于训练和评估PM-VLN模块及相关框架在导航任务中的性能
  • 跨模态学习研究:探索多模态输入(视觉与语言)在导航任务中的特征对齐与定位方法
  • 城市路径规划分析:基于TR-NY-PIT-central等路径轨迹数据,研究城市环境下的导航路径模式
  • 地标识别与描述研究:利用MC-10多模态地标样本数据,分析地标特征与语言描述的关联
  • Touchdown基准测试:支持在Touchdown数据集及StreetLearn环境下的模型训练与评估
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 345.95 MiB
最后更新 2025年12月18日
创建于 2025年12月18日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。