找到4个数据集

标签: 语料库标注

过滤结果
  • 皮卡德语标注语料库

    2025年12月20日 30 16 8

    数据集概述 该数据集包含25篇皮卡德语文本,经人工标注词性、词元、法语翻译及地点实体,由法国ANR资助的RESTAURE项目产出,标注流程详见指定学术文章。 文件详解 文件名称: corpus_picard_restaure.zip(压缩包) 文件格式: ZIP 包含内容: "extraits_reference_bruts"文件夹(若有):...
    packageimg
  • 塞尔维亚语动词派生名词注释数据库

    2025年12月20日 30 180 84

    数据集概述 本数据集包含塞尔维亚语中动词派生名词的注释数据,通过对CLASSLA-web.sr语料库中动词“očekivati(期待)”后接名词的例句进行人工标注,分析其形态、词缀、基动词及补语等特征,为研究动词派生名词的语言特性提供支持。 文件详解 文件名称: Annotated database of deverbal...
    packageimg
  • 威廉_弗里德曼_巴赫钢琴奏鸣曲标注乐谱语料库

    2025年12月10日 30 10 5

    数据集概述 该数据集为威廉·弗里德曼·巴赫钢琴奏鸣曲的标注乐谱语料库,包含一个压缩文件,未提供详细内容描述,主要用于音乐研究与乐谱分析场景。 文件详解 文件名称:wf_bach_sonatas-v2.3.zip 文件格式:ZIP(.zip) 内容说明:压缩文件,包含威廉·弗里德曼·巴赫钢琴奏鸣曲的标注乐谱相关数据,具体字段及内容需解压后查看 适用场景...
    packageimg
  • 罗马尼亚法律领域命名实体识别数据集

    2025年12月5日 30 90 47

    数据集概述 该数据集是罗马尼亚法律领域的人工标注语料库,包含法律文献中的组织、地点、人物、时间及法律资源实体标注,提供细粒度法律文献类型划分及部分地点的GEONAMES编码,支持多格式访问与语义网络数据应用。 文件详解 数据集以压缩包形式提供,包含多个子文件夹及文件,具体如下: - 压缩包文件: - legalnero.zip:...
    packageimg