-
ELTeC_德国小说语料库_2021年4月发布版
2026年2月1日 30 148 55
数据集概述 本数据集为欧洲文学文本集(ELTeC)的德国小说语料库2021年4月发布版,包含100部按1级编码的小说,共3个文件,无目录结构。数据支持欧洲文学的远程阅读研究,涵盖小说元数据与编码文本,可用于文学特征分析与比较研究。 文件详解 文件名称:README.md 文件格式:MD...
-
ELTeC_nor_Based_挪威小说语料库2021年4月版
2026年1月28日 30 67 31
数据集概述 本数据集为欧洲文学文本集合(ELTeC)的挪威语分支(ELTeC-nor)2021年4月发布版本,包含53部以1级编码的挪威小说。数据集提供语料库文件、元数据及说明文档,支持欧洲文学远程阅读研究,共含3个文件。 文件详解 README.md 文件格式:MD...
-
EPFL_Publications_Based_EPFL出版物配套数据_1_1_0
2026年1月14日 30 117 76
数据集概述 本数据集为EPFL(洛桑联邦理工学院)出版物配套数据,版本号1.1.0,包含20个文件,无目录层级。文件分为XLSX和ODT两种格式,各占50%,主要关联WATERSPOUTT项目相关的学术出版物,覆盖不同作者、年份及期刊的研究成果。 文件详解 数据文件(XLSX格式,共10个)...
-
ELTeC_Portuguese_Novel_Corpus_欧洲文学文本语料库数据2021
2026年1月13日 30 90 32
数据集概述 本数据集为ELTeC-por葡萄牙语小说语料库2021年4月发布版本,包含100部采用1级和2级编码的葡萄牙语小说,涉及元数据、说明文档及压缩文件三类内容,可支持欧洲文学文本的数字化分析研究。 文件详解 README.md 文件格式:MD 字段映射介绍:包含项目说明、发布版本信息(v2.0.0等)、DOI标识及COST...
-
欧洲文学文本集_法国小说语料库2021
2025年12月20日 30 157 112
数据集概述 本数据集是欧洲文学文本集(ELTeC)的法国小说语料库,由COST Action“欧洲文学史的远读”项目制作,版本为v1.0.1。包含法国小说文本及元数据,所有文本均属于公有领域,为文学研究提供标准化语料支持。 文件详解 该数据集包含三个文件,具体说明如下: - 文件名称: ELTeC-fra_metadata.tsv - 文件格式:...
-
数据18世纪法国小说数据集1751_1800
2025年12月14日 30 159 62
数据集概述 该数据集包含1751至1800年间创作或首次出版的200部18世纪法国小说的数字化文本,以TEI/XML格式存储,同时提供精简版和扩展版TSV元数据文件,为法国文学研究提供结构化的文本资源。 文件详解 核心文件: roman18-novels_and_scripts.zip:压缩文件,包含所有TEI/XML格式的小说文本及相关脚本...
-
西班牙语小说语料库2021_04
2025年12月7日 30 207 85
数据集概述 该数据集是2021年4月发布的西班牙语小说语料库(ELTeC-spa),包含八十三个按一级标准编码的小说。数据集由元数据文件、说明文档和压缩包组成,为欧洲文学文本研究提供结构化的西班牙语小说资源。 文件详解 metadata.csv(CSV格式):包含西班牙语小说的元数据信息,字段包括id(语料库编号)、author-...
-
罗马尼亚小说语料库2021年4月版
2025年12月4日 30 70 30
数据集概述 该数据集是2021年4月发布的罗马尼亚小说语料库(ELTeC-rom),包含95部按第一层级编码的小说,提供了小说元数据、说明文档及压缩文件包,为欧洲文学文本相关研究提供基础数据支持。 文件详解 文件名称: metadata.csv 文件格式: CSV 字段映射: 包含id(编号)、author-name(作者名)、book-...



