-
ARAFA_Generated_Based_阿拉伯语大规模事实核查数据集
2026年1月21日 30 9 2
数据集概述 本数据集是面向阿拉伯语自然语言处理的大规模事实核查数据集ARAFA,通过大语言模型自动化框架构建,包含181,976条标注为支持、反驳或信息不足的主张-证据对,可用于阿拉伯语自动事实核查模型训练与评估。 文件详解 文件名称:ARAFA.json 文件格式:JSON...
-
业务流程描述中歧义检测的标注数据集
2025年12月21日 30 51 32
数据集概述 本数据集包含七十一条业务流程描述的歧义标注数据,采用Franceschetti等人提出的业务流程管理(BPM)歧义分类体系进行标注,涵盖声明式和命令式两种流程描述类型,为研究业务流程文本中的歧义识别提供标注资源。 文件详解 综合标注数据文件: Ambiguity Annotations - All...
-
能源话题地理社交媒体文本分类数据集
2025年12月15日 30 24 20
数据集概述 本数据集围绕能源话题的地理社交媒体文本分类研究,包含标注的推特数据集、验证集、交互式可视化地图、地理数据文件及分析代码,支持通过自然语言处理技术分析公众对化石燃料、核能及可再生能源的立场。 文件详解 标注数据集: labeled_datasets.zip:...



