数据集概述
本数据集是意大利骑士文学作品《13/5 Sferamundi di Grecia. Quinta parte》的数字学术版本,包含转录及评注的XML-TEI文件、多格式电子书和用于计算分析的纯文本文件,属于Mambrino数字图书馆项目,由维罗纳大学开发,支持古典文学的数字化研究。
文件详解
- 转录及评注文件
- 文件名称:SM5_source.xml、SM5_commentary.xml
- 文件格式:XML
- 字段映射介绍:采用TEI(文本编码倡议)标准编码,包含作品原文转录内容及学术评注信息,结构化呈现文本及注释关联关系
- 电子书文件
- 文件格式:未明确具体格式(说明中提及multiple formats)
- 内容说明:提供多格式电子书版本,支持不同阅读场景需求
- 计算分析文本文件
- 文件格式:TXT
- 内容说明:纯文本格式,便于开展文本挖掘、词频分析等计算语言学研究
数据来源
Progetto Mambrino Digital Library(维罗纳大学外国语与文学系)
适用场景
- 意大利古典文学研究: 用于分析《13/5 Sferamundi di Grecia》的文本内容、文学风格及骑士文学主题
- 数字人文技术应用: 基于XML-TEI文件探索古典文本的数字化编码、结构化存储及语义关联方法
- 计算语言学分析: 利用纯文本文件开展词频统计、主题建模等量化研究
- 数字图书馆资源建设: 为骑士文学数字资源的标准化整理与共享提供参考案例