找到5个数据集

标签: 人工标注数据

过滤结果
  • 复现包_基于OpenAI的嵌入语义代码审查评论相似度实证分析_2025

    2026年1月23日 30 62 18

    数据集概述 本数据集是SEAA 2025会议论文《OpenAI嵌入在语义代码审查评论相似度中的实证分析》的复现包,包含所有人工标注数据及可复现论文结果和图表的Jupyter笔记本,共4个文件,支持研究人员验证和扩展相关分析。 文件详解 人工标注数据文件...
    packageimg
  • SO_Solution_Snippets_Stack_Overflow解决方案片段呈现与复用研究数据

    2026年1月5日 30 155 79

    数据集概述 本数据集为Stack Overflow平台解决方案片段研究的支撑数据,包含两类人工标注文件:一类是对含解决方案片段的问题的分类数据,另一类是对解决方案片段的标注数据。数据用于分析Stack Overflow中解决方案片段的呈现方式及复用适配方法,为提升知识共享效率和优化生成式AI工具提供参考。 文件详解 Manual-...
    packageimg
  • 教育西班牙语问答数据集_ESQAD

    2025年12月19日 30 179 107

    数据集概述 本数据集为西班牙语教育场景下的问答生成(QAG)任务构建,包含与西班牙大学入学考试(EVAU)课程对齐的人工标注数据、文学及法律领域自动生成数据,以及经师生验证的试点研究子集,支持多场景QAG模型开发与评估。 文件详解 该数据集包含四类结构化数据文件,具体说明如下: - EVAU课程对齐数据 -...
    packageimg
  • 自然语言处理大型语言模型蜕变测试数据集2025

    2025年12月19日 30 103 86

    数据集概述 本数据集是ICSME 2025会议论文相关研究的配套数据,围绕自然语言处理(NLP)任务中大型语言模型(LLM)的蜕变测试展开,包含RQ1至RQ3及额外分析的实验结果、人工标注与汇总数据,所有文件以JSON格式存储,为LLM蜕变测试研究提供支撑。 文件详解 该数据集以ZIP压缩包形式组织,内部包含多个JSON文件和目录,具体说明如下: -...
    packageimg
  • BigGrams半监督HTML信息提取系统数据集

    2025年12月15日 30 2 0

    数据集概述 该数据集为BigGrams半监督HTML信息提取系统相关的参考数据集,包含从真实网站抓取的网页数据,以及对应网站的人工标注参考实例数据,用于支持半监督信息提取方法的研究与验证。 文件详解 数据集包含一个ZIP压缩文件,解压后包含两个主要文件夹,具体说明如下: - 压缩文件: bigrams-reference-data-...
    packageimg