-
Multi_CAST_Arta_Based多语言口语标注文本数据集2311
2026年1月21日 30 60 16
数据集概述 本数据集为Multi-CAST Arta多语言口语标注文本语料库,是Multi-CAST项目的一部分,收录于《Multi-CAST: Multilingual corpus of annotated spoken texts》第2311版本中。数据以压缩包形式提供,包含多语言口语文本的标注内容,适用于语言学领域的多语言口语研究。 文件详解...
-
德国政治演讲语料库
2025年12月22日 30 126 7
数据集概述 该数据集是一个文本档案库,聚焦于1990年以来德国高层官员的政治演讲,按政治相关性筛选。数据包含带有元数据的XML格式文本文件,是自然语言处理和语料库语言学研究的资源。 文件详解 文件名称: German-political-speeches-2019-release.zip 文件格式: ZIP压缩包 内容说明:...



