找到2个数据集

标签: 测试语料

过滤结果
  • Multi_CAST_Based_Multi_CAST_Teop多语言医疗CT标注语音文本数据集_V1905

    2025年12月29日 30 120 98

    数据集概述 本数据集为Multi-CAST多语言标注语音文本语料库的一部分,聚焦医疗CT相关的语音文本标注内容。数据由班贝格大学发布,版本为1905,包含1个压缩文件,无训练测试或数据标签拆分,核心语义关键词为医疗CT,是研究多语言医疗语音文本标注的基础语料。 文件详解 压缩文件 文件名称:Multi-CAST/mcteop-v1905.zip...
    packageimg
  • 爱尔兰民间传说与格雷戈里夫人改编文本语料库

    2025年12月23日 30 205 134

    数据集概述 该数据集包含十四篇英文爱尔兰民间传说原文及十四篇格雷戈里夫人的英文改编文本,支持原文与文学改写的比较分析,可用于研究编辑风格、改编实践及通过重述塑造爱尔兰文化遗产的过程。 文件详解 metadata.xlsx:Excel格式,可能包含语料库的元数据信息 README.txt:纯文本格式,提供数据集的基本说明和使用指引 original-...
    packageimg