Google_Scholar学术档案引用数据集2022

数据集概述

本数据集包含2022年从Google Scholar学术档案中提取的11,375条国际研究者随机样本数据,覆盖41个国家。数据包含16个从h指数、i10指数等原始指标衍生的特征,以CSV格式存储,适用于预测引用量的回归任务,可解决默认指标的局限性。

文件详解

  • Google Scholar Profile Citation Data/Metadata.pdf:PDF格式文档,提供数据集的元数据说明
  • Google Scholar Profile Citation Data/Google Scholar Profile Citation Data.xlsx:Excel格式数据文件,包含11,375条研究者样本数据,涵盖16个衍生特征字段,支持数据/标签拆分

适用场景

  • 学术影响力预测:基于研究者档案特征构建模型预测引用量
  • 科研评价指标优化:分析衍生特征对学术影响力评估的补充价值
  • 国际科研群体特征分析:研究不同国家研究者的学术产出模式差异
  • 机器学习回归任务训练:作为多特征回归问题的训练数据集
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 2.12 MiB
最后更新 2025年11月30日
创建于 2025年11月28日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。