ECSEE25_SupplementaryMaterial_编程教育抄袭检测技术研究数据

数据集概述

本数据集是论文“Towards Robust Plagiarism Detection in Programming Education: Introducing Tolerant Token Matching Techniques to Counter Novel Obfuscation Methods”的补充材料,包含支持论文研究的代码实现、评估数据集、AI混淆生成资源及原始结果数据,为编程教育领域抄袭检测技术研究提供完整支持。

文件详解

  • 压缩包文件
  • 文件名称:SupplementaryMaterial-ECSEE25.zip
  • 文件格式:ZIP
  • 字段映射介绍:压缩包内包含四类核心内容:
  • code:基于JPlag的方法实现(代码及jar包)
  • datasets:评估用的学生程序及混淆抄袭样本
  • gpt:AI混淆生成使用的提示词和脚本
  • results:评估的原始结果数据

数据来源

论文“Towards Robust Plagiarism Detection in Programming Education: Introducing Tolerant Token Matching Techniques to Counter Novel Obfuscation Methods”

适用场景

  • 编程教育抄袭检测技术研究:分析容忍令牌匹配技术在应对新型混淆方法时的性能
  • AI辅助混淆生成研究:基于gpt模块的提示词和脚本,探究AI混淆编程代码的机制
  • 抄袭检测工具开发:利用code模块的JPlag实现,开发或优化编程教育场景下的抄袭检测工具
  • 教育评估数据支撑:通过datasets和results模块,验证抄袭检测方法在真实学生程序场景中的有效性
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 221.88 MiB
最后更新 2026年1月13日
创建于 2026年1月13日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。