NASA天文学图片每日一图数据集

NASA天文学图片每日一图数据集 数据来源:互联网公开数据 标签:NASA,天文学,图片,每日一图,教育,研究,图像处理,文本分析,关键词提取,实体识别

数据概述: 本数据集包含了NASA自1995年6月以来在其“Astronomy Picture of the Day”网站上发布的每日宇宙图片及其专业天文学家撰写的简短说明。数据集基于NASA开放API获取的原始数据,通过图像处理库PIL和文本分析库spaCy对图片信息和说明文本进行了增强和扩展。数据集包含超过10,000条记录,时间范围从1995年6月到2023年12月底。数据集分为一个CSV文件(nasa-apod-dataset.csv),文件中共有15个字段,使用分号分隔。

数据用途概述: 该数据集适用于天文教育、科学研究、图像分析、文本挖掘等场景。研究人员可以利用此数据集进行天文现象的研究和图像处理技术的开发;教育机构可以利用数据集进行天文教育;文本分析专家可以利用说明文本进行关键词提取和实体识别的研究。此外,数据集也适合用于开发相关应用程序和进行科普活动。

字段定义: - date:APOD图片的日期。 - title:APOD图片的标题。 - copyright:图片的版权信息。若版权信息为空,则表示图片为公共领域。 - explanation:由专业天文学家撰写的图片说明。 - keywords:从说明文本中提取的前20个关键词,以逗号分隔的列表形式呈现。 - named_entities:从说明文本中提取的命名实体,以逗号分隔的列表形式呈现。 - media_type:媒体类型,通常为图片,有时也可能为视频或其他类型。 - media_url:媒体的高清URL。若无高清版本,则使用标准清晰度的URL。 - img_format:图片的格式(如GIF、JPEG等)。 - img_mode:图片中像素的类型和深度。 - img_width_px:图片的宽度,以像素为单位。 - img_height_px:图片的高度,以像素为单位。 - camera_make:拍摄图片的相机品牌。 - camera_model:拍摄图片的相机型号。 - software:用于保存或编辑图片的软件,有时也包含操作系统信息。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 4.11 MiB
最后更新 2025年4月15日
创建于 2025年4月15日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。