找到2个数据集

标签: 语料库资源建设

过滤结果
  • Multi_CAST_Arta_Based多语言口语标注文本数据集2311

    2026年1月21日 30 60 16

    数据集概述 本数据集为Multi-CAST Arta多语言口语标注文本语料库,是Multi-CAST项目的一部分,收录于《Multi-CAST: Multilingual corpus of annotated spoken texts》第2311版本中。数据以压缩包形式提供,包含多语言口语文本的标注内容,适用于语言学领域的多语言口语研究。 文件详解...
    packageimg
  • 德国政治演讲语料库

    2025年12月22日 30 126 7

    数据集概述 该数据集是一个文本档案库,聚焦于1990年以来德国高层官员的政治演讲,按政治相关性筛选。数据包含带有元数据的XML格式文本文件,是自然语言处理和语料库语言学研究的资源。 文件详解 文件名称: German-political-speeches-2019-release.zip 文件格式: ZIP压缩包 内容说明:...
    packageimg