-
HTR_Winter_School_2023_2024_加洛林拉丁语手稿转录基准数据
2026年1月18日 30 120 84
数据集概述 本数据集是HTR Winter School 2023/2024加洛林拉丁语小组发布的转录基准数据,包含维也纳奥地利国家图书馆Cod. 473(《教皇史》部分内容)和Cod. 1239(带注释的保罗书信)的转录文本,分为带注释和不带注释两种版本,并提供Cod. 473的对应图像文件,遵循Tim Geelhaar的加洛林小写字母转录规范。...
-
Transkribus_Based_约翰_克里索斯托姆讲道手稿列表及人工转录数据_V1_2
2026年1月13日 30 82 80
数据集概述 本数据集包含用于Transkribus手写文本识别(HTR)训练实验的约翰·克里索斯托姆《提多书讲道》手稿列表及人工转录样本。手稿年代为10至14世纪,数据集提供CSV格式的手稿清单及TEI标准格式的XML人工转录文件,支持HTR模型训练的基础数据需求。 文件详解 文件名称:sample_dataset-chrysostomus-...
-
HTR_2023_2024_年冬季学校_维也纳国家图书馆_ONB_3891_号中世纪拉丁语手稿转录数据
2026年1月3日 30 172 86
数据集概述 本数据集为2023/2024年维也纳HTR手写文本识别冬季学校产出的中世纪晚期拉丁语手稿底本数据,对应维也纳国家图书馆(ÖNB)Cod....
-
TEI_XML_Based_萨克森选帝侯约翰_格奥尔格二世1665年宫廷日记完整转录数据_Release2
2025年12月30日 30 120 33
数据集概述 本数据集包含1665年萨克森选帝侯约翰·格奥尔格二世宫廷日记(SLUB Mscr.Dresd.K.80)的完整手写转录版本,遵循DTABF标准提供TEI:XML格式文件及PDF阅读版。XML文件通过元素拆分日记条目,标注日期、人物、地点及格式元素,PDF由TEIGarage简单转换生成,未优化排版。 文件详解 文件名称:SLUB Dresd...
-
约翰_丁斯代尔_形而上学_第三卷第15问抄本_达勒姆大教堂图书馆手稿C_IV_20A
2025年12月18日 30 121 16
数据集概述 该数据集是约翰·丁斯代尔关于《形而上学》第三卷第15问(“存在与一是否为事物的本原”)的抄本转录,对应达勒姆大教堂图书馆手稿C.IV.20A的29rb至vb页内容,以单一PDF文件形式呈现。 文件详解 文件名称: John_Dinsdale_-_Qu._super_libr._Metaph._III_qu._15_Anzalone.pdf...
-
法国国家图书馆24428号法文手稿自动转录数据集
2025年12月14日 30 115 32
数据集概述 该数据集记录了使用Transkribus工具对法国国家图书馆24428号十三世纪法文手稿的自动转录工作,包含训练模型的报告及转录文本文件,为中世纪手稿数字化研究提供支持。 文件详解 文件名称:Automatic Transcription of BnF ms fr 24428 with Transkribus.pdf 文件格式:PDF...
-
PAVONe_阿拉伯语新约译本平台数据集
2025年12月9日 30 8 2
数据集概述 该数据集对应PAVONe平台,聚焦于新约福音书的早期阿拉伯语译本研究。平台包含数字化及转录的阿拉伯语福音书手稿与经文选读集数字语料库,附带有文本、古文字学、抄本学、语言学等多层元数据,还提供文本研究工具,为相关学术研究提供支持。 文件详解 文件名称: pavone.pdf 文件格式: PDF(.pdf) 文件内容:...



