数据集概述
本数据集是关于开放科学实证研究的映射综述数据,整合了2000-2020年Scopus和Web of Science数据库中相关文献,经PRISM方法筛选和协作标注,最终包含695项同行评审研究,覆盖研究主题、方法、学科等维度,旨在呈现开放科学研究现状与缺口。
文件详解
- 核心数据文件(CSV格式,共5个)
mapOSR_info.csv:开放科学研究基础信息文件
mapOSR_codebook_V4.csv:编码手册,包含字段编号、名称、描述、编码值及说明,如Action(研究行动)、Method(研究方法)等字段的定义
mapOSR_interrater_reliability_clean.csv:编码者间信度数据,含ID、两位编码者对Action、Method、Discipline等字段的编码结果
mapOSR_data_V5_9_3_220419_coded_clean.csv:标注后的开放科学研究核心数据集(2022年4月19日版本)
mapOSR_version_history.csv:数据集版本历史记录
- 参考文献文件
mapOSR_references.bib:BIB格式的研究参考文献
- 文档文件(DOCX格式,共2个)
mapOSR_PRISMA_flow_diagram_v4_220419.docx:PRISMA文献筛选流程图(2022年4月19日版本)
mapOSR_PRISMA_2020_checklist.docx:PRISMA 2020规范检查表
数据来源
MapOSR项目(Mapping Review Dataset of Empirical Studies on Open Science)
适用场景
- 开放科学研究趋势分析:基于编码数据研究2000-2020年开放科学实证研究的主题演进、方法偏好及学科分布
- 开放科学政策制定:分析不同地理区域、学术群体的开放科学实践特征,为政策优化提供数据支撑
- 文献计量学研究:利用数据集的文献筛选流程和标注信息,开展开放科学领域的文献计量分析
- 编码信度方法验证:基于编码者间信度数据,验证开放科学研究标注体系的可靠性
- 开放科学研究缺口识别:通过数据集覆盖范围,定位开放科学实证研究中未充分探索的主题或学科领域