找到6个数据集

标签: 标注语料库

过滤结果
  • 柴可夫斯基四季乐谱标注语料库

    2025年12月19日 30 119 83

    数据集概述 本数据集为柴可夫斯基《四季》乐谱的标注语料库,包含一套经过标注的乐谱文件,以压缩包形式存储,可用于音乐分析、乐谱数字化研究等场景。 文件详解 文件名称:DCMLab/tchaikovsky_seasons-v2.3.zip 文件格式:ZIP压缩包(.zip)...
    packageimg
  • 头巾相关数字极化分析的YouTube评论标注数据集

    2025年12月15日 30 104 73

    数据集概述 本数据集围绕头巾相关话题的数字极化现象,收集并标注了YouTube平台的用户评论,包含原始数据、语料库文件及一致性检验文件,为研究社交媒体上的观点极化提供支持。 文件详解 数据文件(.xlsx格式): Raw Data.xlsx:原始YouTube评论数据 Corpus 1.xlsx:第一部分标注语料库 Corpus...
    packageimg
  • iRead4Skills_数据集2_多语言标注语料库报告

    2025年12月15日 30 128 103

    数据集概述 本数据集是iRead4Skills项目的第二部分,提供了针对法语、葡萄牙语和西班牙语的复杂度分级标注语料库的详细报告,包含分类标注流程、数据构成、质量分析及标注样本等核心内容。 文件详解 文件名称: iRead4Skills_D3.7_Dataset_Annotated_Corpora_Report.pdf 文件格式: PDF (.pdf)...
    packageimg
  • COVID_19相关生物医学自然语言处理词典与标注语料库工具包

    2025年12月13日 30 189 157

    数据集概述 本数据集为生物医学自然语言处理任务提供工具包,包含COVID-19相关的英文词典、标注语料库及代码工作流。词典覆盖疾病、病毒、变异株等术语,用于从CORD-19数据集提取信息,构建大型银标准语料库,辅以人工标注的金标准语料库,支持命名实体识别等文本分析任务。 文件详解...
    packageimg
  • 古典藏文标注语料库2020_Version2_带分词与词性标注

    2025年12月7日 30 13 1

    数据集概述 该数据集为古典藏文标注语料库(ACTib)第二版,包含超一亿八千五百万个词元,基于XML文件构建,提供分词与词性标注的压缩文件,采用自动后处理方法,未涉及人工校正。 文件详解 数据集包含11个压缩文件,具体说明如下: - 压缩文件组(共11个.zip格式文件): - SegPOS-...
    packageimg
  • 贝多芬标注乐谱语料库

    2025年12月6日 30 127 28

    数据集概述 该数据集为贝多芬乐谱的标注语料库(ABC),包含使用标准化标签进行和声分析的乐谱数据,以压缩包形式存储,未划分训练测试集、数据标签或原始/处理数据。 文件详解 文件名称: DCMLab/ABC-v2.6.zip 文件格式: ZIP压缩包 内容说明: 压缩包内包含贝多芬乐谱的标注语料库数据,具体字段及结构未通过预览提供 适用场景 音乐学研究:...
    packageimg