-
ELTeC_nor_Based_挪威小说语料库2021年4月版
2026年1月28日 30 12 0
数据集概述 本数据集为欧洲文学文本集合(ELTeC)的挪威语分支(ELTeC-nor)2021年4月发布版本,包含53部以1级编码的挪威小说。数据集提供语料库文件、元数据及说明文档,支持欧洲文学远程阅读研究,共含3个文件。 文件详解 README.md 文件格式:MD...
-
西班牙语小说语料库2021_04
2025年12月7日 30 180 59
数据集概述 该数据集是2021年4月发布的西班牙语小说语料库(ELTeC-spa),包含八十三个按一级标准编码的小说。数据集由元数据文件、说明文档和压缩包组成,为欧洲文学文本研究提供结构化的西班牙语小说资源。 文件详解 metadata.csv(CSV格式):包含西班牙语小说的元数据信息,字段包括id(语料库编号)、author-...
-
罗马尼亚小说语料库2021年4月版
2025年12月4日 30 142 92
数据集概述 该数据集是2021年4月发布的罗马尼亚小说语料库(ELTeC-rom),包含95部按第一层级编码的小说,提供了小说元数据、说明文档及压缩文件包,为欧洲文学文本相关研究提供基础数据支持。 文件详解 文件名称: metadata.csv 文件格式: CSV 字段映射: 包含id(编号)、author-name(作者名)、book-...
-
DNA序列长度分类数据集DNASequenceLengthClassificationDataset-mwildan
2025年5月1日 30 58 52
DNA序列长度分类数据集DNASequenceLengthClassificationDataset-mwildan 数据来源:互联网公开数据 标签:DNA序列, 基因组学, 序列分析, 长度分类, 生物信息学, 数据挖掘, 机器学习, 序列比对 数据概述: 该数据集包含DNA序列数据,记录了DNA序列及其对应的长度类别。主要特征如下:...



