机器学习模型在软件复用性评估与预测中的应用数据集2022

数据集概述

该数据集包含用于Maltesque 2022会议投稿的研究资料,围绕机器学习模型在软件复用性评估与预测中的应用展开,涵盖原始数据、实验结果及代码笔记本,为相关研究提供支持。

文件详解

  • 数据文件:
  • GitHub-Java-ExternalMetricsData.csv:CSV格式,包含项目名称、分支数、发布数等软件外部指标数据
  • GitHub-Java-InternalMetricsData.csv:CSV格式,包含项目内聚度、代码行数等软件内部指标数据
  • 代码文件:
  • Classification-Modelling.ipynb:Jupyter Notebook格式,用于执行分类建模的代码脚本
  • 结果文件:
  • results.zip:压缩包格式,包含不同预处理方法和分类器组合的实验结果
  • 文档文件:
  • SourceMeter-Metrics-Description.html:HTML格式,提供指标描述文档
  • README.txt:TXT格式,包含运行脚本的环境依赖和操作步骤说明

适用场景

  • 软件工程研究:分析软件内部/外部指标与复用性的关联
  • 机器学习应用:验证不同分类模型在软件复用性预测任务中的性能
  • 实证研究复现:复现Maltesque 2022会议相关投稿的实验结果
  • 软件质量评估:探索软件复用性评估的有效指标与方法
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 75.54 MiB
最后更新 2025年12月4日
创建于 2025年12月4日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。