数据集概述
该数据集收集了DARPA SCORE项目中关于不同学术领域研究结果复制率的社区预测数据,包括预测市场交易数据、调查数据、人口统计数据及相关分析脚本与文档,揭示学术界对复制危机的看法及各领域复制率预期差异。
文件详解
- 数据文件:
- final_market_data.csv:CSV格式,包含预测市场交易数据,字段包括trade_id(交易ID)、user_id(用户ID)、question_id(问题ID)、question_wording(问题描述)、trade_time(交易时间)、old_prob(原概率)、new_prob(新概率)
- final_survey_data.csv:CSV格式,包含社区调查数据,记录关于各学术领域复制率的预测结果
- final_demography_data.csv:CSV格式,包含受访者人口统计数据,字段包括start_time(开始时间)、end_time(结束时间)、user_id(用户ID)、question_code(问题编码)、question_wording(问题描述)、response_code(回答编码)、response_wording(回答内容)
- ssr_data.xlsx:Excel格式,可能包含与复制率相关的补充统计数据
- codebook.xlsx:Excel格式,数据集的代码本,解释各数据文件的字段含义与编码规则
- 分析脚本:
- Final_Script.R:R语言脚本,用于数据集的分析与处理
- 文档文件:
- SCORE_PREREG_META_FINAL.pdf:PDF格式,包含项目预注册元分析的最终文档
数据来源
DARPA SCORE项目
适用场景
- 学术出版研究:分析不同学科研究结果的可复制性预期及时间趋势
- 科学计量学分析:探究学术社区对复制危机的认知差异
- 科研政策制定:为提升研究可靠性的政策提供数据支持
- 预测市场机制研究:验证预测市场在科研评估中的应用效果