洪堡数字版第十一版11_0_1版TEI_XML数据集

数据集概述

该数据集是2025年6月4日发布的洪堡数字版第十一版11.0.1版的TEI-XML格式数据,包含日记、信件、文献、研究论文、年表条目、索引等编辑文本及副文本,对HTML版本进行了技术错误修正。

文件详解

  • 文件名称: edition_humboldt_digital_v11.zip
  • 文件格式: ZIP压缩包
  • 内容说明: 压缩包内包含洪堡数字版11.0.1版的所有TEI-XML格式数据,具体涵盖编辑文本(日记、信件、其他文献)和副文本(研究论文、洪堡生平年表条目、索引、术语表)。数据模型基于三个不同的ODD(用于编辑文本、索引条目、研究论文),并附带三个RNG模式文件;植物索引无独立模式,由标注自动生成。

适用场景

  • 数字人文研究: 用于洪堡数字版文本的结构化分析与挖掘
  • 历史文献学研究: 支持对洪堡日记、信件等原始文献的深度文本分析
  • 数字编辑方法研究: 可作为TEI-XML格式数字编辑实践的案例参考
  • 学术资源整合: 为洪堡相关研究提供标准化的结构化文献数据支持
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 20.1 MiB
最后更新 2025年12月8日
创建于 2025年12月8日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。