数据集

代码质量评估与代码异味分析数据集CodeQualityAssessmentandCodeSmellAnalysisDataset-kolliparajaswanth030

数据来源：互联网公开数据

标签：代码质量, 代码异味, 软件工程, 静态分析, 机器学习, 软件维护, 代码度量, 开源项目

数据概述：该数据集包含来自多个开源Java项目的代码质量评估和代码异味分析数据，旨在为研究人员和开发人员提供一个用于代码质量分析、模型训练和评估的资源。主要特征如下：时间跨度：数据集涵盖了不同年份的代码提交和版本信息，具体时间跨度取决于每个项目的更新频率，数据收集时间不明确，但提供了不同版本的数据。地理范围：数据来源于多个开源Java项目，这些项目分布于全球范围内，但数据本身不涉及地理位置信息。数据维度：数据集包含多个维度的数据，主要包括：代码仓库信息：如项目名称、仓库链接、提交次数、分支数量、发布版本数量、贡献者数量、星标数量、关注者数量、Fork数量和数据收集日期等。代码异味信息：包括代码异味的类型、出现位置、详细描述、出现次数等。代码度量指标：如代码复杂度、耦合度、代码行数、类数量、包数量、外部包数量、外部类数量、问题类数量、高问题类数量等。代码版本信息：包括版本号、提交次数、代码行数、类数量、包数量、外部包数量、外部类数量、问题类数量、高问题类数量、版本链接等。代码属性细节：如代码规则、代码异味、详细信息、计数等。数据格式：数据主要以CSV格式存储，方便进行数据分析和处理。文件组织结构清晰，便于根据项目、版本和代码异味类型进行数据提取和分析。来源信息：数据来源于多个开源Java项目，数据已进行结构化处理，方便进行代码质量分析和建模。该数据集适合用于代码质量评估、代码异味检测、软件缺陷预测、代码维护成本评估等领域的研究。

数据用途概述：该数据集具有广泛的应用潜力，特别适用于以下场景：研究与分析：适用于软件工程、代码质量分析、机器学习等领域的学术研究，如代码异味识别、缺陷预测模型构建、代码重构策略研究等。行业应用：可以为软件开发行业提供数据支持，特别是在代码质量管理、自动化代码审查、持续集成与持续交付（CI/CD）流程优化等方面。决策支持：支持软件开发团队的代码质量评估和改进决策，帮助团队提高代码质量、降低维护成本、提升软件可靠性。教育和培训：作为软件工程、代码质量分析等课程的辅助材料，帮助学生和研究人员深入理解代码质量评估和代码异味分析。此数据集特别适合用于探索代码异味与软件质量之间的关系，以及构建基于代码度量指标的预测模型，帮助用户提升代码质量、优化软件开发流程。

数据与资源

代码质量评估与代码异味分析数据集CodeQualityAssessmentandCodeSme...ZIP
85.11 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	85.11 MiB
最后更新	2025年5月19日
创建于	2025年5月19日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

代码质量评估与代码异味分析数据集CodeQualityAssessmentandCodeSmellAnalysisDataset-kolliparajaswanth030

数据与资源

附加信息

注册成功！