数据集概述
该数据集是Spacekit机器学习算法的数据集、模型及训练结果的集合。包含不同类型的文件,覆盖HST、JWST等空间任务相关数据,以及支持SVM等机器学习方法的训练和测试数据,通过版本控制管理更新。
文件详解
该数据集包含16个文件,具体说明如下:
- 压缩文件(.zip格式,共12个):
- 空间任务相关数据:hst_cal_std_2021-08-22.zip、hst_cal_std_2021-10-28.zip、jwst_cal.zip、hst_cal.zip等,包含HST和JWST的校准数据等
- 训练数据:k2-exo-flux-ts-train.csv.zip,包含开普勒K2任务的系外行星光变曲线训练数据
- 模型相关数据:hst_drz_svm_2022-01-30.zip、hst_drz_svm_2022-01-16.zip,包含HST的DRZ数据及SVM模型相关内容
- CSV数据文件(.csv格式,共3个):
- hst_cal_categorized_subset.csv:字段包括category、target、description、x_files、x_size等,为分类的HST校准子集数据
- svm_labeled_2021-07-28.csv:字段包括numexp、rms_ra、rms_dec、nmatches、label等,为带标签的SVM训练数据
- svm_unlabeled_2021-10-06.csv:未标注的SVM数据文件
- 其他文件:
- pytest_data.tgz:tgz格式的测试数据文件
适用场景
- 空间科学机器学习研究:用于训练和测试Spacekit相关的机器学习算法
- 天文数据处理分析:基于HST、JWST等空间望远镜数据开展校准、分类等研究
- 系外行星研究:利用k2-exo-flux-ts-train.csv等数据进行系外行星光变曲线分析
- 支持向量机(SVM)模型开发:基于带标签和未标签的SVM数据进行模型训练与优化