找到2个数据集

标签: OCR优化

过滤结果
  • Pinkas_Based_近代早期欧洲犹太社区手稿数字化数据集2019

    2026年1月26日 30 17 3

    数据集概述 本数据集源自近代早期(约1500-1800年)记录欧洲犹太社区的希伯来文历史手稿,包含三十页高分辨率彩色JPG格式数字化图像,手稿存在多种退化、复杂排版及非专业抄写员的多样手写体,增加识别难度。同时提供PAGE格式的真值标注,涵盖词、行、页层级,定义了官方训练测试集划分及三种词定位基线方法。 文件详解...
    packageimg
  • 葡萄牙语发票收据图像及字段标注数据集

    2025年12月14日 30 178 49

    数据集概述 该数据集包含八百一十三张葡萄牙语的私人公司发票与收据图像,以及对应文本文件,记录了销售方名称、地址、税号、购买方税号、发票日期、总金额、税额和文档编号等关键字段的转录信息。 文件详解 1_Images.zip:压缩文件,包含所有发票与收据的图像文件,格式未提及。...
    packageimg