数据集

ECSEE25_SupplementaryMaterial_编程教育抄袭检测技术研究数据

数据集概述

本数据集是论文“Towards Robust Plagiarism Detection in Programming Education: Introducing Tolerant Token Matching Techniques to Counter Novel Obfuscation Methods”的补充材料，包含支持论文研究的代码实现、评估数据集、AI混淆生成资源及原始结果数据，为编程教育领域抄袭检测技术研究提供完整支持。

文件详解

压缩包文件
文件名称：SupplementaryMaterial-ECSEE25.zip
文件格式：ZIP
字段映射介绍：压缩包内包含四类核心内容：
code：基于JPlag的方法实现（代码及jar包）
datasets：评估用的学生程序及混淆抄袭样本
gpt：AI混淆生成使用的提示词和脚本
results：评估的原始结果数据

数据来源

论文“Towards Robust Plagiarism Detection in Programming Education: Introducing Tolerant Token Matching Techniques to Counter Novel Obfuscation Methods”

适用场景

编程教育抄袭检测技术研究：分析容忍令牌匹配技术在应对新型混淆方法时的性能
AI辅助混淆生成研究：基于gpt模块的提示词和脚本，探究AI混淆编程代码的机制
抄袭检测工具开发：利用code模块的JPlag实现，开发或优化编程教育场景下的抄袭检测工具
教育评估数据支撑：通过datasets和results模块，验证抄袭检测方法在真实学生程序场景中的有效性

数据与资源

15069764.zipZIP
221.88 MiB

下载

附加信息

字段	值
作者	Maxj
版本	1
数据集大小	221.88 MiB
最后更新	2026年1月13日
创建于	2026年1月13日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。