数据集概述
本数据集是《Pythonic函数式构造可理解性研究》论文的复现数据包,包含实验材料、原始/处理数据及分析脚本,支持复现论文中关于Python函数式构造对代码可理解性影响的控制实验结果,数据已匿名化处理。
文件详解
该数据集由多个目录和文件组成,具体说明如下:
- 实验材料目录(Experiment-Material/):
- Google-Forms/:10个实验组问卷(PDF格式)
- Task-Sources/:各实验组任务源文件,含任务说明(Word/TXT)、代码片段及图片
- Code-Examples-Table1/:研究用代码片段(对应论文表1)
- 结果目录(Results/):
- raw-responses/:参与者原始问卷响应(电子表格)
- raw-results-RQ1/:RQ1原始结果,含各实验组用户代码输出及预期输出
- working-results/:
- RQ1-RQ2-files-for-statistical-analysis/:统计分析用CSV文件(ConstructUsage.csv、RQ1.csv、RQ1Paired-RQ2.csv)
- inter-rater-RQ3-files/:RQ3评分者信度分析CSV文件(comprehension.csv等)
- RQ2ManualValidation.csv:RQ2手动验证结果
- RQ3ManualValidation.xlsx:RQ3开放编码结果(含4个工作表)
- 分析脚本:
- FuncConstructs-Statistics.r:R分析脚本
- FuncConstructs-Statistics.ipynb:Jupyter Notebook(R内核)
- 运行脚本:run-analysis.sh/.bat、run-jupyter-container.sh/.bat
数据来源
Zenodo(https://doi.org/10.5281/zenodo.8191782)
适用场景
- 软件工程研究:复现Python函数式构造对代码可理解性的影响实验
- 统计方法应用:验证混合效应逻辑回归、序数逻辑回归在代码理解研究中的应用
- 定性分析参考:参考RQ3开放编码及评分者信度分析方法
- 实验设计借鉴:学习控制实验在编程认知研究中的设计与实施