ELTeC_gsw_Based_瑞士德语小说集_公开数据集

数据集概述

本数据集是欧洲文学文本集合(ELTeC)的瑞士德语小说子集,由COST Action "Distant Reading for European Literary History"项目生成,包含100部符合语料库构成标准的瑞士德语小说,采用TEI编码,支持欧洲文学远程阅读研究,总计102个文件。

文件详解

  • 核心数据文件
  • 文件名称:遵循GSW[编号]_[作者]_[作品名]_[年份].xml模式(如GSW0071_bernoulli_gesundgarten_1906.xml)
  • 文件格式:XML
  • 字段映射介绍:采用TEI编码的小说文本数据,包含100部瑞士德语小说的结构化内容
  • 元数据文件
  • 文件名称:level0_metadata-ELTEC-gsw.xlsx
  • 文件格式:XLSX
  • 字段映射介绍:数据集的元数据信息,记录小说的基本属性
  • 说明文档
  • 文件名称:README.md
  • 文件格式:MD
  • 字段映射介绍:数据集的发布说明、编码规范等文档信息

数据来源

COST Action "Distant Reading for European Literary History"(CA16204)

适用场景

  • 欧洲文学远程阅读研究:用于分析瑞士德语小说的文学特征、主题演变与语言风格
  • 德语文学语料库建设:补充瑞士德语文学文本资源,支持多语言文学对比研究
  • 数字人文研究:通过结构化XML数据开展文本挖掘、作者归属分析等数字人文项目
  • 文学教育与资源共享:为瑞士德语文学教学和研究提供标准化的公开文本资源
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 51.01 MiB
最后更新 2026年1月30日
创建于 2026年1月30日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。