数据集概述
本数据集包含爱沙尼亚多帕特地区弟兄会团体1805年8月至1806年5月的教区报告转录文件,源自赫恩胡特合一档案馆的《弟兄会消息》(Gemein-Nachrichten)手稿。数据集提供XML-TEI格式的转录文件及标准化文本,用于支持宗教历史研究与文本分析。
文件详解
- 文件名称:00407_01.xml
- 文件格式:XML-TEI
- 字段映射介绍:基于原始数字化档案转录的XML-TEI导出文件,对应ID索引的手稿转录内容。
- 文件名称:00407_02.xml
- 文件格式:XML-TEI
- 字段映射介绍:补充元数据的XML-TEI转录文件,在原始转录基础上增加标准化元数据信息。
- 文件名称:00407_03.docx
- 文件格式:DOCX
- 字段映射介绍:标准化文本文件,适用于机器学习分析等进一步使用场景。
- 文件名称:00407_04.xml
- 文件格式:XML-TEI
- 字段映射介绍:包含元数据与术语表注释的增强型XML-TEI转录文件。
数据来源
Unitätsarchiv Herrnhut(赫恩胡特合一档案馆)
适用场景
- 宗教历史研究: 分析19世纪初爱沙尼亚地区弟兄会团体的教会活动与传教工作。
- 文本数字化与转录技术应用: 研究XML-TEI格式在历史手稿转录与元数据标注中的实践。
- 历史文献机器学习分析: 利用标准化文本文件开展宗教文献的主题建模、情感分析等量化研究。
- 教会档案管理研究: 探索宗教团体历史档案的数字化保存与元数据标准化方法。