数据集概述
本数据集为《Codice diplomatico longobardo 1-2》的TEI XML版本,收录公元714至774年间托斯卡纳地区的原始伦巴第外交宪章及同期副本。数据由Luigi Schiaparelli编辑,奥地利科学院中世纪研究所提供数字化版本,保留与形态句法分析相关的缩写扩展、脱漏标注等外交信息,添加ChLA编号便于与摹本对比,仅含一个XML文件。
文件详解
- 文件名称:CDL_TEI_XML_base_text_for_LLCT.xml
- 文件格式:XML
- 字段映射介绍:采用TEI标准格式,包含原始宪章及副本的文本内容,保留与形态句法分析相关的"expan"(缩写扩展)、"damage"(脱漏标注)等外交信息,使用"abbr"(未扩展缩写)、"gap"(未书写空格)标签,添加ChLA编号用于摹本对比,省略行与页码信息。
数据来源
奥地利科学院中世纪研究所数字化版本,基于Luigi Schiaparelli编辑的《Codice diplomatico longobardo 1-2》(罗马:参议院印刷厂,1929-1933年)
适用场景
- 中世纪拉丁语言学研究:分析公元8世纪托斯卡纳地区拉丁语文本的形态句法特征与语言演变。
- 伦巴第外交史研究:通过原始宪章内容探究伦巴第时期的外交制度与文书规范。
- 数字人文文本标注:基于TEI XML格式开展中世纪文献的数字化标注与语义分析。
- 历史文献对比研究:利用ChLA编号关联宪章摹本,进行文本版本校勘与源流考证。