-
皮卡德语标注语料库
2025年12月20日 30 16 8
数据集概述 该数据集包含25篇皮卡德语文本,经人工标注词性、词元、法语翻译及地点实体,由法国ANR资助的RESTAURE项目产出,标注流程详见指定学术文章。 文件详解 文件名称: corpus_picard_restaure.zip(压缩包) 文件格式: ZIP 包含内容: "extraits_reference_bruts"文件夹(若有):...
-
塞尔维亚语动词派生名词注释数据库
2025年12月20日 30 180 84
数据集概述 本数据集包含塞尔维亚语中动词派生名词的注释数据,通过对CLASSLA-web.sr语料库中动词“očekivati(期待)”后接名词的例句进行人工标注,分析其形态、词缀、基动词及补语等特征,为研究动词派生名词的语言特性提供支持。 文件详解 文件名称: Annotated database of deverbal...
-
威廉_弗里德曼_巴赫钢琴奏鸣曲标注乐谱语料库
2025年12月10日 30 10 5
数据集概述 该数据集为威廉·弗里德曼·巴赫钢琴奏鸣曲的标注乐谱语料库,包含一个压缩文件,未提供详细内容描述,主要用于音乐研究与乐谱分析场景。 文件详解 文件名称:wf_bach_sonatas-v2.3.zip 文件格式:ZIP(.zip) 内容说明:压缩文件,包含威廉·弗里德曼·巴赫钢琴奏鸣曲的标注乐谱相关数据,具体字段及内容需解压后查看 适用场景...
-
罗马尼亚法律领域命名实体识别数据集
2025年12月5日 30 90 47
数据集概述 该数据集是罗马尼亚法律领域的人工标注语料库,包含法律文献中的组织、地点、人物、时间及法律资源实体标注,提供细粒度法律文献类型划分及部分地点的GEONAMES编码,支持多格式访问与语义网络数据应用。 文件详解 数据集以压缩包形式提供,包含多个子文件夹及文件,具体如下: - 压缩包文件: - legalnero.zip:...



