-
范妮_门德尔松致威廉_亨塞尔书信转录数据集
2025年12月14日 30 5 1
数据集概述 本数据集包含范妮·门德尔松致丈夫威廉·亨塞尔的122封书信转录内容,源自柏林国家图书馆的两文件夹藏品,共250页、2240行文本,以PAGE、ALTO及基础TEI格式存储,支持历史书信研究与手写文本识别模型训练。 文件详解 文件名称:1878144588.zip、1878121294.zip 文件格式:ZIP压缩包...
-
WeGA数据包裹_Carl_Maria_von_Weber全集数字版
2025年12月14日 30 157 62
数据集概述 本数据集是Carl-Maria-von-Weber全集(Carl-Maria-von-Weber-Gesamtausgabe)的数字版,包含TEI和MEI格式文档。数据从内部WeGA TEI格式转换而来,符合TEI_all和mei_all标准,保留全部信息,内部引用通过URI实现。 文件详解...
-
数据18世纪法国小说数据集1751_1800
2025年12月14日 30 28 13
数据集概述 该数据集包含1751至1800年间创作或首次出版的200部18世纪法国小说的数字化文本,以TEI/XML格式存储,同时提供精简版和扩展版TSV元数据文件,为法国文学研究提供结构化的文本资源。 文件详解 核心文件: roman18-novels_and_scripts.zip:压缩文件,包含所有TEI/XML格式的小说文本及相关脚本...
-
Softcite数据集_研究出版物中的软件提及标注数据集
2025年12月4日 30 47 17
数据集概述 该数据集是研究出版物中软件提及的标注数据集,包含生物医学和经济学领域开放获取文献中的软件提及标注,涉及软件名称、版本、访问URL等信息,以TEI/XML格式存储,还包含描述数据集设计与创建过程的论文。 文件详解 文件名称:howisonlab/softcite-dataset-v1.0.zip 文件格式:ZIP压缩包 压缩包内包含:...



