找到2个数据集

标签: PAGE

过滤结果
  • NewsEye_READ_AS_19世纪芬兰报纸训练数据集

    2025年12月24日 30 132 91

    数据集概述 该数据集包含19世纪芬兰报纸页面的带注释文本数据,共200页训练集页面图像由芬兰国家图书馆(NLF)提供,数据按PAGE格式构建,通过Transkribus平台生成,附带相关指南文档,为报纸文本识别模型训练提供支持。 文件详解 文件名称: Article GT guidelines for...
    packageimg
  • 范妮_门德尔松致威廉_亨塞尔书信转录数据集

    2025年12月14日 30 114 44

    数据集概述 本数据集包含范妮·门德尔松致丈夫威廉·亨塞尔的122封书信转录内容,源自柏林国家图书馆的两文件夹藏品,共250页、2240行文本,以PAGE、ALTO及基础TEI格式存储,支持历史书信研究与手写文本识别模型训练。 文件详解 文件名称:1878144588.zip、1878121294.zip 文件格式:ZIP压缩包...
    packageimg