找到3个数据集

标签: 词元数

过滤结果
  • 数据18世纪法国小说数据集1751_1800

    2025年12月14日 30 35 13

    数据集概述 该数据集包含1751至1800年间创作或首次出版的200部18世纪法国小说的数字化文本,以TEI/XML格式存储,同时提供精简版和扩展版TSV元数据文件,为法国文学研究提供结构化的文本资源。 文件详解 核心文件: roman18-novels_and_scripts.zip:压缩文件,包含所有TEI/XML格式的小说文本及相关脚本...
    packageimg
  • 英语历史中并列与从属结构复制及补充材料数据集

    2025年12月13日 30 98 87

    数据集概述 本数据集是George Walkden研究《英语历史中并列与从属结构》的复制及补充材料,包含CSV格式的分析数据、查询脚本、图表PDF及说明文档,支持相关研究的复现与扩展分析。 文件详解 数据文件(CSV格式,64个): 示例文件:csv_subtypes_PPCME2_frl.csv、csv_data-...
    packageimg
  • 斯洛文尼亚小说语料库2021年4月版

    2025年12月8日 30 95 2

    数据集概述 该数据集是2021年4月发布的斯洛文尼亚小说语料库,包含一百部小说,均采用一级和二级编码。数据内容与上一版本保持一致,为欧洲文学文本相关研究提供结构化的文学文本资源。 文件详解...
    packageimg