数据集概述
本数据集是论文“Towards Robust Plagiarism Detection in Programming Education: Introducing Tolerant Token Matching Techniques to Counter Novel Obfuscation Methods”的补充材料,包含支持论文研究的代码实现、评估数据集、AI混淆生成资源及原始结果数据,为编程教育领域抄袭检测技术研究提供完整支持。
文件详解
- 压缩包文件
- 文件名称:SupplementaryMaterial-ECSEE25.zip
- 文件格式:ZIP
- 字段映射介绍:压缩包内包含四类核心内容:
- code:基于JPlag的方法实现(代码及jar包)
- datasets:评估用的学生程序及混淆抄袭样本
- gpt:AI混淆生成使用的提示词和脚本
- results:评估的原始结果数据
数据来源
论文“Towards Robust Plagiarism Detection in Programming Education: Introducing Tolerant Token Matching Techniques to Counter Novel Obfuscation Methods”
适用场景
- 编程教育抄袭检测技术研究:分析容忍令牌匹配技术在应对新型混淆方法时的性能
- AI辅助混淆生成研究:基于gpt模块的提示词和脚本,探究AI混淆编程代码的机制
- 抄袭检测工具开发:利用code模块的JPlag实现,开发或优化编程教育场景下的抄袭检测工具
- 教育评估数据支撑:通过datasets和results模块,验证抄袭检测方法在真实学生程序场景中的有效性