-
ECSEE25_SupplementaryMaterial_编程教育抄袭检测技术研究数据
2026年1月13日 30 150 13
数据集概述 本数据集是论文“Towards Robust Plagiarism Detection in Programming Education: Introducing Tolerant Token Matching Techniques to Counter Novel Obfuscation...
-
PAN22作者分析_风格变化检测数据集
2025年12月10日 30 64 33
数据集概述 该数据集为PAN 2022风格变化检测任务的专用数据,包含三个子数据集,分别对应基础、进阶和真实场景三类子任务,覆盖段落及句子层级的风格变化定位需求,支持模型训练与评估。 文件详解 文件名称: pan22.zip 文件格式: ZIP压缩包 内容说明:...
-
编程竞赛Java代码抄袭数据集_ConPlag
2025年12月8日 30 65 53
数据集概述 该数据集为ConPlag,是首个聚焦编程竞赛场景的Java代码抄袭数据集,包含相关代码抄袭数据及配套说明文档,为编程竞赛作弊检测研究提供基础数据支持。 文件详解 文件名称:conplag.zip 文件格式:ZIP压缩包...
-
软件相似度数据集
2025年12月4日 30 97 88
数据集概述 该数据集包含软件相似度学习的后处理数据,涉及软件功能的嵌入表示、软件信息提取结果及软件对的相似度评分数据,支持软件相似度相关研究与分析。 文件详解 数据压缩包: data.zip:ZIP格式压缩包,可能包含软件功能嵌入与信息提取的原始或处理后数据,如嵌入的软件图表示、函数名称及对应调用函数和函数令牌的信息。 相似度评分文件:...
-
学术论文查重结果评估数据集AcademicPaperPlagiarismDetectionResultsEvaluation-azharabdulaziz
2025年5月1日 30 156 144
学术论文查重结果评估数据集AcademicPaperPlagiarismDetectionResultsEvaluation-azharabdulaziz 数据来源:互联网公开数据 标签:学术论文, 查重, 抄袭检测, 评估, 性能指标, TPR, FPR, F1值, 数据分析 数据概述:...
-
越南维基百科抄袭检测数据集VietnameseWikipediaPlagiarismDetectionDataset-dungg1810
2025年4月25日 30 82 49
越南维基百科抄袭检测数据集VietnameseWikipediaPlagiarismDetectionDataset-dungg1810 数据来源:互联网公开数据 标签:数据集,抄袭检测,文本分析,自然语言处理,机器学习,学术诚信,信息检索,越南语 数据概述: 该数据集包含来自越南维基百科的文本数据,记录了用于抄袭检测的文本样本。主要特征如下:...
-
斯里兰卡僧伽罗语语境抄袭检测数据集-tharukac
2025年4月21日 30 5 0
斯里兰卡僧伽罗语语境抄袭检测数据集-tharukac 数据来源:互联网公开数据 标签:抄袭检测,僧伽罗语,学术研究,数据集,文本分析,语料库 数据概述:...



