-
NewsEye_READ_AS_19世纪芬兰报纸训练数据集
2025年12月24日 30 23 19
数据集概述 该数据集包含19世纪芬兰报纸页面的带注释文本数据,共200页训练集页面图像由芬兰国家图书馆(NLF)提供,数据按PAGE格式构建,通过Transkribus平台生成,附带相关指南文档,为报纸文本识别模型训练提供支持。 文件详解 文件名称: Article GT guidelines for...
-
数据19世纪奥地利报纸OCR训练数据集_NewsEye_READ
2025年12月4日 30 37 8
数据集概述 该数据集包含19世纪至20世纪初奥地利报纸页面的经人工校正文本数据,分为训练集(148页)和验证集(13页),采用PAGE格式存储,由Transkribus平台生成,支持NewsEye与READ项目研究。 文件详解 训练集文件:...



