找到9个数据集

标签: 班贝格大学

过滤结果
  • Multi_CAST_Arta_Based多语言口语标注文本数据集2311

    2026年1月21日 30 184 3

    数据集概述 本数据集为Multi-CAST Arta多语言口语标注文本语料库,是Multi-CAST项目的一部分,收录于《Multi-CAST: Multilingual corpus of annotated spoken texts》第2311版本中。数据以压缩包形式提供,包含多语言口语文本的标注内容,适用于语言学领域的多语言口语研究。 文件详解...
    packageimg
  • Multi_CAST_Based_多语言口语文本标注语料库数据_v2211

    2026年1月21日 30 40 34

    数据集概述 本数据集为Multi-CAST项目中的Tulil语料库,属于多语言口语文本标注语料库,由Meng, Chenxi于2022年创建,收录于班贝格大学发布的Multi-CAST版本2211中,包含医疗相关的CT语义关键词,是研究多语言口语文本标注的基础资源。 文件详解 文件名称:Multi-CAST/mctulil-v2211.zip...
    packageimg
  • Multi_CAST_Tondano_多语言语音文本标注语料库数据2023

    2026年1月21日 30 12 2

    数据集概述 本数据集为Multi-CAST多语言标注语音文本语料库的一部分,包含Tondano语言的语音文本标注数据,由Timothy Brickell于2023年贡献,收录于Geoffrey Haig和Stefan Schnell主编的语料库版本2311中,用于多语言语音文本研究。 文件详解 文件名称:Multi-...
    packageimg
  • Multi_CAST_Based_多语言口语文本标注语料库_Mandarin_Version2311

    2026年1月4日 30 80 42

    数据集概述 本数据集为Multi-CAST多语言口语标注文本语料库的中文部分,由Maria Vollmer于2023年贡献,收录于Geoffrey Haig和Stefan Schnell主编的语料库版本2311中。数据以压缩包形式提供,是研究中文口语标注文本的基础语料资源。 文件详解 文件名称:Multi-...
    packageimg
  • Multi_CAST_Nafsan_Based多语言口语文本标注语料库数据2311

    2026年1月15日 30 60 57

    数据集概述 本数据集为Multi-CAST多语言口语文本标注语料库的一部分,具体包含Nafsan语言的口语文本标注数据。该语料库由班贝格大学发布,属于Multi-CAST项目的2311版本,是多语言口语文本资源的重要组成部分。 文件详解 压缩文件 文件名称:mcnafsan-v2311.zip 文件格式:ZIP 字段映射介绍:压缩包内包含Multi-...
    packageimg
  • Multi_CAST_Based_Kalamang语言口语文本标注语料库数据_v2311

    2026年1月13日 30 50 22

    数据集概述 本数据集为Multi-CAST多语言口语文本标注语料库的一部分,包含Kalamang语言的标注口语文本数据。数据集由Eline Visser于2023年贡献,属于Multi-CAST语料库的2311版本,旨在为语言学研究提供标准化的多语言口语资源。 文件详解 文件名称:Multi-CAST/mckalamang-v2311.zip...
    packageimg
  • Multi_CAST_Source_Northern_Kurdish多语言语音文本标注数据2311

    2026年1月7日 30 91 63

    数据集概述 本数据集为Multi-CAST多语言语音文本标注语料库的一部分,包含Northern Kurdish语言的语音文本标注数据。该语料库由班贝格大学发布,是多语言口语文本标注资源的重要组成,可用于相关语言研究与自然语言处理应用。 文件详解 文件名称:Multi-CAST/mcnkurd-v2311.zip 文件格式:ZIP...
    packageimg
  • Multi_CAST_Source_Sanzhi_Dargwa多语言语音标注文本数据_2311版本

    2026年1月6日 30 12 9

    数据集概述 本数据集为Multi-CAST多语言标注语音文本语料库的一部分,包含Sanzhi Dargwa语言的标注语音文本数据,版本为2311。数据集由班贝格大学发布,是多语言语音语言学研究的结构化资源,仅包含一个压缩文件。 文件详解 文件名称:Multi-CAST/mcsanzhi-v2311.zip 文件格式:ZIP...
    packageimg
  • Multi_CAST_Based_Multi_CAST_Teop多语言医疗CT标注语音文本数据集_V1905

    2025年12月29日 30 168 3

    数据集概述 本数据集为Multi-CAST多语言标注语音文本语料库的一部分,聚焦医疗CT相关的语音文本标注内容。数据由班贝格大学发布,版本为1905,包含1个压缩文件,无训练测试或数据标签拆分,核心语义关键词为医疗CT,是研究多语言医疗语音文本标注的基础语料。 文件详解 压缩文件 文件名称:Multi-CAST/mcteop-v1905.zip...
    packageimg