-
索拉尼库尔德语高质量自动命名实体识别数据集2024
2025年11月29日 30 146 145
数据集概述 该数据集是针对低资源语言索拉尼库尔德语的自动标注命名实体识别(NER)资源,包含二零二四年发布的两千三百余篇新闻文章,覆盖政治、经济等六个领域,采用BIO标注方案,含六十五万余词元及十二类实体类型,用于支持库尔德语自然语言处理研究。 文件详解 主目录文件: Adyan_metadata.txt:TXT格式,可能包含数据集元信息...
2025年11月29日 30 146 145