找到3个数据集

标签: PAGE

过滤结果
  • Pinkas_Based_近代早期欧洲犹太社区手稿数字化数据集2019

    2026年1月26日 30 133 20

    数据集概述 本数据集源自近代早期(约1500-1800年)记录欧洲犹太社区的希伯来文历史手稿,包含三十页高分辨率彩色JPG格式数字化图像,手稿存在多种退化、复杂排版及非专业抄写员的多样手写体,增加识别难度。同时提供PAGE格式的真值标注,涵盖词、行、页层级,定义了官方训练测试集划分及三种词定位基线方法。 文件详解...
    packageimg
  • NewsEye_READ_AS_19世纪芬兰报纸训练数据集

    2025年12月24日 30 206 131

    数据集概述 该数据集包含19世纪芬兰报纸页面的带注释文本数据,共200页训练集页面图像由芬兰国家图书馆(NLF)提供,数据按PAGE格式构建,通过Transkribus平台生成,附带相关指南文档,为报纸文本识别模型训练提供支持。 文件详解 文件名称: Article GT guidelines for...
    packageimg
  • 范妮_门德尔松致威廉_亨塞尔书信转录数据集

    2025年12月14日 30 126 65

    数据集概述 本数据集包含范妮·门德尔松致丈夫威廉·亨塞尔的122封书信转录内容,源自柏林国家图书馆的两文件夹藏品,共250页、2240行文本,以PAGE、ALTO及基础TEI格式存储,支持历史书信研究与手写文本识别模型训练。 文件详解 文件名称:1878144588.zip、1878121294.zip 文件格式:ZIP压缩包...
    packageimg