NASA_Based_系外行星出版物摘要预处理数据集

数据集概述

本数据集为NASA收集的系外行星相关出版物摘要预处理数据,包含5个文件,存储为可导入Pandas的JSON格式压缩文件及说明文档,便于研究者快速获取系外行星文献的结构化摘要信息。

文件详解

  • Readme.md
  • 文件格式:MD
  • 字段映射介绍:包含数据集标题、日期、作者及内容说明,列出各数据文件的核心内容
  • dfExoplanetsNASA.json.zip
  • 文件格式:ZIP(含JSON)
  • 字段映射介绍:存储包含摘要的系外行星出版物基础数据
  • dfExoplanetsNASAabs.json.zip
  • 文件格式:ZIP(含JSON)
  • 字段映射介绍:存储经过预处理的系外行星出版物摘要数据
  • dfExoplanetsNASAabsSentences.json.zip
  • 文件格式:ZIP(含JSON)
  • 字段映射介绍:存储通过Spacy提取的系外行星摘要句子级数据
  • dfConfirmedExoplanetsNASA.json.zip
  • 文件格式:ZIP(含JSON)
  • 字段映射介绍:存储已确认系外行星相关的出版物摘要数据

数据来源

NASA archive

适用场景

  • 系外行星研究文献计量分析: 统计系外行星领域的研究热点、发表趋势及核心机构
  • 天文文本语义挖掘: 基于摘要句子级数据,分析系外行星研究的技术术语、研究方法与结论
  • 机器学习训练数据构建: 为系外行星主题分类、摘要生成等NLP任务提供结构化文本数据
  • 天文领域知识图谱构建: 从摘要中提取系外行星相关实体(如行星名称、观测设备)及关系
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 57.18 MiB
最后更新 2026年1月31日
创建于 2026年1月31日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。