WeCode学生提交与IT001课程成绩数据集-2021-itsgad
数据来源:互联网公开数据
标签:编程课程,学生表现,代码提交,预测模型,教育数据,编程行为,学术成绩
数据概述:
本数据集包含了来自WeCode平台的匿名学生提交数据及其对应于《编程入门》(IT001)课程的成绩信息。该数据集提供了探索学生编程行为与学术成绩之间关系的独特机会,允许基于学生的代码提交模式预测其课程表现。
数据集包含两部分主要数据:
- WeCode提交数据(annonimized.csv):
该文件包含了学生在WeCode平台上针对IT001课程的详细提交信息。每行代表一次提交尝试,包括以下特征:
- assignment_id:每个作业的唯一标识符
- problem_id:每个作业中子问题的唯一标识符
- username:匿名的学生标识符
- is_final:表示提交是否为最终评分(1表示最终评分,0表示非最终评分)的二进制指示器
- status:代码执行状态(例如,“SCORE”、“Compilation Error”)
- pre_score:应用任何迟交作业惩罚前获得的分数
- coefficient:由于迟交作业应用的惩罚系数
- language_id:提交所使用的编程语言
- created_at:提交的时间戳
- updated_at:评分的时间戳
- judgement:详细的提交评估结果,包括每个测试案例的执行时间和内存使用情况以及错误测试案例的数量
-
测试案例通过百分比(四舍五入到两位小数并乘以100)
-
学生成绩数据(tbtl-public.csv, qt-public.csv等):
这些文件包含了大约800名学生在IT001课程中的学术成绩。每个文件专注于特定的成绩组成部分:
- tbtl-public.csv:包含学生在IT001课程结束后一年的平均成绩(GPA)
- qt-public.csv:包含期中考试成绩
- th-public.csv:包含实验成绩
- ck-public.csv:包含期末考试成绩
- hash:匿名的学生标识符
每个文件的标题显示了该文件包含的成绩组成部分
数据用途概述:
该数据集的主要目标是开发和评估能够基于学生在WeCode上的提交模式预测其IT001课程表现的模型。这可以涉及预测学生的各种表现方面,包括:
- 期末考试成绩
- 期中考试成绩
- 实验成绩
- 课程结束后一年的平均成绩(GPA)
潜在应用场景:
- 提前识别有风险的学生:基于该数据训练的模型可以帮助识别可能在课程中表现不佳的学生,从而允许进行早期干预和支持
- 个性化学习:通过分析提交模式获得的见解可以为设计符合个体学生需求的个性化学习体验提供依据
- 理解学习行为:该数据集为有兴趣研究学生如何编程以及影响入门编程课程中成功因素的研究人员提供了宝贵的资源
- 改进教育平台:该数据集的发现可用于改进在线编程平台(如WeCode)的设计和功能
重要说明:
如果学生的成绩出现在成绩数据文件中,但其对应的预测结果在提交结果中缺失,系统将自动为该学生分配0的预测值。