找到3个数据集

标签: 小语种

过滤结果
  • Luxembourgish_word_embedding_Based_RTL_lu用户评论训练模型数据

    2026年1月2日 30 53 51

    数据集概述 本数据集是基于卢森堡媒体平台RTL.lu的用户评论训练的卢森堡语词嵌入模型,包含2008年12月至2018年12月期间约54.4万条卢森堡语文本数据,为卢森堡语自然语言处理任务提供语义向量支持。 文件详解 文件名称:Luxembourgish word embedding_RTL user comments.zip 文件格式:ZIP...
    packageimg
  • 库巴_列兹金语城市田野调查数据集2019

    2025年12月23日 30 204 128

    数据集概述 该数据集是2019至2020年冬季学期科隆大学语言学研究所“城市田野调查”课程的实践成果,包含与阿塞拜疆列兹金语母语者合作采集的库巴-列兹金语资料,涵盖基础词汇、传统儿歌、民谣及相关元数据与项目文档。 文件详解 数据集包含四类核心内容文件,具体说明如下: - 斯瓦迪士核心词表文件(40词节选): - William-...
    packageimg
  • 柏林城市田野研究_普什图语数据集2018

    2025年12月7日 30 61 42

    数据集概述 该数据集为柏林洪堡大学"城市田野研究"项目的普什图语子项目成果,包含普什图语核心变体的语言资料,主要为四十个斯瓦迪士词汇表录音及形容词比较级诱发实验的音频、文本与标注文件,用于记录柏林的小语种语言特征。 文件详解 音频文件(.wav格式): 2018-06-04_C-...
    packageimg