找到3个数据集

标签: NLP模型训练评估

过滤结果
  • ARAFA_Generated_Based_阿拉伯语大规模事实核查数据集

    2026年1月21日 30 9 2

    数据集概述 本数据集是面向阿拉伯语自然语言处理的大规模事实核查数据集ARAFA,通过大语言模型自动化框架构建,包含181,976条标注为支持、反驳或信息不足的主张-证据对,可用于阿拉伯语自动事实核查模型训练与评估。 文件详解 文件名称:ARAFA.json 文件格式:JSON...
    packageimg
  • 业务流程描述中歧义检测的标注数据集

    2025年12月21日 30 51 32

    数据集概述 本数据集包含七十一条业务流程描述的歧义标注数据,采用Franceschetti等人提出的业务流程管理(BPM)歧义分类体系进行标注,涵盖声明式和命令式两种流程描述类型,为研究业务流程文本中的歧义识别提供标注资源。 文件详解 综合标注数据文件: Ambiguity Annotations - All...
    packageimg
  • 能源话题地理社交媒体文本分类数据集

    2025年12月15日 30 24 20

    数据集概述 本数据集围绕能源话题的地理社交媒体文本分类研究,包含标注的推特数据集、验证集、交互式可视化地图、地理数据文件及分析代码,支持通过自然语言处理技术分析公众对化石燃料、核能及可再生能源的立场。 文件详解 标注数据集: labeled_datasets.zip:...
    packageimg