图神经网络研究领域论文-作者-机构与研究方向数据集-2021-junhonglin

图神经网络研究领域论文-作者-机构与研究方向数据集-2021-junhonglin 数据来源:互联网公开数据 标签:图神经网络,异构图,论文,作者,机构,研究方向,学术研究,机器学习,图表示学习

数据概述: 本数据集源自开放图基准(Open Graph Benchmark)的ogbn-mag和修改后的mag-year数据集,它们均基于微软学术图谱(Microsoft Academic Graph, MAG)的子集构建。数据集构建了一个异构图,包含四种类型的节点:论文(736,389个节点)、作者(1,134,649个节点)、机构(8,740个节点)和研究方向(59,965个节点)。节点之间存在四种类型的有向关系。每篇论文都关联一个128维的word2vec特征向量。作者的特征是通过平均其所有发表论文的节点特征得到的。

数据用途概述: ogbn-mag数据集用于预测每篇论文发表的场所(会议或期刊),共有349个不同的场所。mag-year数据集用于预测论文发表的年份,将发表年份划分为五个类别,以使类别比例大致平衡。该数据集适用于图神经网络、异构图学习等研究,可用于论文发表场所预测、论文发表年份预测等任务,为学术界在图结构数据上的机器学习研究提供了重要的实验平台。

数据与资源

附加信息

字段
版本 1.0
最后更新 五月 31, 2025, 03:54 (UTC)
创建于 五月 31, 2025, 03:51 (UTC)