优秀数据集图谱

优秀数据集图谱 数据来源:互联网公开数据 标签:数据集图谱,Neo4j,图数据库,数据分类,数据科学,数据源,数据目录,项目决策 数据概述: 优秀数据集图谱是一个Neo4j图数据库,该数据库对从Awesome Public Datasets GitHub列表中抓取和分类的数据集和数据源进行了目录编制。我们从一个简单的Awesome Public Datasets页面链接列表开始,现在拥有一个语义图数据库,包含10个标签、五种关系类型、九个属性键及超过400个节点,整个数据库的大小不到1MB。所有数据库操作均通过强大的Cypher图查询语言进行查询驱动。 数据用途概述: 该图谱适用于数据科学工作流中的数据目录编制、数据源发现和项目决策记录等多种场景。研究人员和数据科学家可以利用此图谱记录和跟踪数据科学项目在不同阶段所做的决策,并利用数据目录中的信息(数据源、数据集、工具等)用例来优化数据科学解决方案策略。 举例: 下载内容包括CSV文件,这些文件是在抓取和整理源数据后创建的中间文件。此外,下载还包括一个可运行的Neo4j图数据库。默认登录信息为:用户名 neo4j,密码 demo。该图谱通过对Awesome Public Datasets页面的数据抓取和分类,为用户提供了一个全面的数据目录和分类工具,有助于提高数据科学项目的效率和效果。

数据与资源

附加信息

字段
版本 1.0
最后更新 四月 14, 2025, 16:05 (UTC)
创建于 四月 14, 2025, 16:04 (UTC)