巴黎与耶路撒冷地图文本数据集

数据集概述

本数据集包含八十二份来自巴黎与耶路撒冷历史城市地图的标注样本,以JSON和PKL格式存储地图文本的多边形坐标、转录内容及质量标签(如是否截断、难以辨认),适用于地图文本检测、识别与序列分析任务。

文件详解

  • 核心标注文件:
  • maptext_format.json:JSON格式,按图像和序列分组结构存储数据,包含图像名称、文本多边形顶点(顺时针排列)、文本转录内容、illegible(是否难以辨认)、truncated(是否截断)字段
  • pandas_format.pkl:PKL格式,与JSON文件内容一致,为方便使用设计
  • 辅助文件:
  • example_annotation.png:PNG格式,标注示例图
  • images.zip:ZIP压缩包,包含所有地图图像文件
  • README.md:MD格式,数据集说明文档

数据来源

  • 巴黎地图:Historical City Maps Semantic Segmentation Dataset(原始数据来自法国国家图书馆、巴黎市历史图书馆)
  • 耶路撒冷地图:以色列国家图书馆、维基共享资源

适用场景

  • 计算机视觉研究:地图文本检测、多边形坐标定位算法开发
  • 自然语言处理研究:历史地图文本识别、多语言(含特殊字符)转录模型训练
  • 历史地理分析:基于地图文本的城市空间布局演变研究
  • 数据标注方法论:历史文档文本质量标签(截断、难以辨认)标注体系构建
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 99.91 MiB
最后更新 2025年12月16日
创建于 2025年12月16日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。