-
COVID_19相关生物医学自然语言处理词典与标注语料库工具包
2025年12月13日 30 23 19
数据集概述 本数据集为生物医学自然语言处理任务提供工具包,包含COVID-19相关的英文词典、标注语料库及代码工作流。词典覆盖疾病、病毒、变异株等术语,用于从CORD-19数据集提取信息,构建大型银标准语料库,辅以人工标注的金标准语料库,支持命名实体识别等文本分析任务。 文件详解...
-
古典藏文标注语料库2020_Version2_带分词与词性标注
2025年12月7日 30 100 2
数据集概述 该数据集为古典藏文标注语料库(ACTib)第二版,包含超一亿八千五百万个词元,基于XML文件构建,提供分词与词性标注的压缩文件,采用自动后处理方法,未涉及人工校正。 文件详解 数据集包含11个压缩文件,具体说明如下: - 压缩文件组(共11个.zip格式文件): - SegPOS-...
-
贝多芬标注乐谱语料库
2025年12月6日 30 73 9
数据集概述 该数据集为贝多芬乐谱的标注语料库(ABC),包含使用标准化标签进行和声分析的乐谱数据,以压缩包形式存储,未划分训练测试集、数据标签或原始/处理数据。 文件详解 文件名称: DCMLab/ABC-v2.6.zip 文件格式: ZIP压缩包 内容说明: 压缩包内包含贝多芬乐谱的标注语料库数据,具体字段及结构未通过预览提供 适用场景 音乐学研究:...



