基准数据仓库调查与模型评估数据集

数据集概述

本数据集包含对一百五十余个数据仓库的综合调查结果,涵盖元数据文档标准化、数据管理验证及文献中数据集使用追踪等维度,同时含五个基准仓库的模型评估发现,配套说明文档提供详细字段解释。

文件详解

  • 文件名称: README.pdf,文件格式: PDF,内容为数据集字段描述及补充细节,辅助理解数据结构与背景。
  • 文件名称: survey_model_evaluation.csv,文件格式: CSV,核心字段示例:Name(仓库名称)、URL(仓库链接)、ev_code_files_required(是否要求代码文件)、ev_model_info(模型信息完整性)等,记录五个基准仓库的模型评估结果。
  • 文件名称: repository_survey.csv,文件格式: CSV,核心字段示例:id(仓库编号)、name(仓库名称)、repo_url(仓库链接)、md_dataset_standardized(元数据标准化程度)、md_creator_collected(创建者信息收集情况)等,记录一百五十余个仓库的调查数据。

适用场景

  • 数据仓库研究:分析数据仓库元数据管理与标准化现状
  • 基准模型评估:探究基准数据仓库的模型评估实践差异
  • 学术数据应用:研究数据集在文献中的使用追踪机制
  • 数据管理优化:为数据仓库的元数据规范与管理流程提供参考依据
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.21 MiB
最后更新 2025年12月21日
创建于 2025年12月21日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。