数据集误用对语义克隆检测的影响研究补充材料

数据集概述

本数据集为研究“数据集误用如何影响语义克隆检测”的补充材料,包含手动调查所用的克隆对、调查协议、结果,以及基于大语言模型的数据集评估结果、文献分析代码和综述结果等内容,支持相关研究验证与复现。

文件详解

该数据集包含两个文件夹及相关文件,具体说明如下: - BCB406 文件夹: - 内容:与手动调查所用的406个克隆对相关的数据,包括克隆对子集、手动调查协议、手动调查结果 - Literature 文件夹: - 内容:与文献综述相关的数据,包括基于大语言模型的数据集评估分析结果、文献综述的大语言模型分析代码、文献综述结果 - 根目录文件: - README.md:Markdown格式,说明数据集包含的补充材料清单 - dataset.zip:压缩包格式,可能为数据集的归档文件

适用场景

  • 语义克隆检测研究:分析数据集误用对检测结果的影响机制
  • 大语言模型评估应用:探究大语言模型在数据集质量评估中的作用
  • 软件工程实证研究:验证数据集构建与使用规范对研究结果的重要性
  • 文献综述方法优化:基于大语言模型的文献分析流程改进研究
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 2.6 MiB
最后更新 2025年12月12日
创建于 2025年12月12日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。