TEI_XML_Moravian_See_Voyages_Travel_Diaries_Text_Data

数据集概述

本数据集包含六份摩拉维亚海航行日记的TEI/XML格式文件,记录了不同年份的航行文本内容,可用于历史航行记录的文本分析与研究,支持自然语言处理相关任务。

文件详解

  • 数据文件
  • 文件名称:1753Text.xml、1742Text.xml、1749Text.xml、1761Text.xml、1746Text.xml、1752Text.xml
  • 文件格式:XML
  • 字段映射介绍:采用TEI(文本编码倡议)标准格式,包含航行日记的文本内容及相关XML元数据,支持文本提取与语义分析

适用场景

  • 历史航行记录研究: 分析摩拉维亚海航行日记中的历史事件、航线信息与航行活动
  • 文本编码与标准化研究: 基于TEI/XML格式探索历史文本的结构化编码方法
  • 自然语言处理训练: 作为历史文本语料,用于NLP模型的文本分类、实体识别等任务
  • 数字人文研究: 支持对摩拉维亚海航行相关历史文献的数字化分析与挖掘
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.7 MiB
最后更新 2025年12月31日
创建于 2025年12月31日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。