自然场景下手写文档布局分析基准数据集

数据集概述

该数据集为自然场景下的手写文档布局分析提供基准数据,涵盖不同布局、语言和书写条件的历史与现代手写文档,包含页面分段及对应标签标注,用于评估布局分析方法的泛化能力。

文件详解

  • 文件名称: HDLA-in-the-wild.zip
  • 文件格式: ZIP压缩包
  • 内容说明: 包含自然场景下手写文档布局分析的基准数据,具体文件结构需解压后查看

数据来源

Wikimedia Commons

适用场景

  • 手写文档处理研究: 评估布局分析模型在多样化场景下的泛化能力
  • 文档结构分析: 研究不同语言、书写风格的手写文档分段方法
  • 模型鲁棒性测试: 识别手写文档布局分析算法的性能瓶颈与改进方向
  • 历史文档数字化: 为历史手写文档的结构解析提供测试基准
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 17.42 MiB
最后更新 2025年12月8日
创建于 2025年12月8日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。