找到2个数据集

标签: 英文文本语料

过滤结果
  • 英文维基百科文本数据集

    2025年12月23日 30 162 138

    数据集概述 本数据集包含英文维基百科文本的转储文件,以及相关的测试数据说明文档和压缩工具。数据文件类型多样,涵盖PMD格式文本、压缩包、可执行文件和网页文档,为英文维基百科文本相关的实验或测试提供数据支持。 文件详解 该数据集包含7个文件,具体说明如下: - 文本文件: - enwik8.pmd: PMD格式文件,可能为英文维基百科文本数据 -...
    packageimg
  • 科学演化剖析数据集

    2025年12月20日 30 63 47

    数据集概述 该数据集围绕科学演化展开研究,通过分析1800至2008年间大规模数字化英文文本语料,揭示科学概念的早期使用水平与长期影响力的关联性,包含相关分析结果与模型预测数据。 文件详解 Metadata.html:HTML格式文件,可能包含数据集的元数据信息...
    packageimg