新冠疫情知识图谱构建分析数据集COVID-19KnowledgeGraphConstructionandAnalysisDataset-supertramp01
数据来源:互联网公开数据
标签:新冠疫情, 知识图谱, 社交网络分析, 论文引用, 疾病传播, 数据可视化, 图数据库, 流行病学
数据概述:
该数据集包含新冠疫情相关的论文引用关系与节点信息,用于构建和分析新冠疫情知识图谱。主要特征如下:
时间跨度:数据未明确标注时间,可推测为疫情爆发初期至相关研究发布期间。
地理范围:数据主要来源于全球范围内的学术研究。
数据维度:数据集主要由两部分构成:
covid node.csv:包含论文节点信息,包括论文ID(Id)、论文标题(Label)、时间戳(timeset)和邻接分数(adj_score)等。
covid edge.csv:包含论文间的引用关系,包括引用源(Source)、引用目标(Target)、关系类型(Type)、关系ID(Id)、关系标签(Label)、时间戳(timeset)和权重(Weight)等。
数据格式:数据以CSV格式存储,方便数据分析和图数据库导入。此外,还包含用于数据可视化的png图像文件和gephi文件。
来源信息:数据来源于学术论文和相关研究,经过整理和结构化处理。
该数据集适合用于新冠疫情相关的知识图谱构建、社交网络分析和疾病传播研究。
数据用途概述:
该数据集具有广泛的应用潜力,特别适用于以下场景:
研究与分析:适用于流行病学、信息科学、社会网络分析等领域的学术研究,例如分析论文引用关系,揭示疫情传播规律,构建知识图谱等。
行业应用:可以为医疗健康、科研机构提供数据支持,特别是在疫情监测、疾病溯源、科研成果评估等方面。
决策支持:支持政府部门和医疗机构进行疫情相关的决策制定,辅助制定防控策略。
教育和培训:作为数据科学、图数据库、社交网络分析等课程的实训素材,帮助学生和研究人员理解相关理论和方法。
此数据集特别适合用于探索新冠疫情期间学术研究的关联关系,分析论文的影响力,构建可视化图谱,从而更好地理解疫情传播的动态和规律。