斯隆数字巡天数据集-机器学习与星系形态分类2011-2012-saurabhshahane
数据来源:互联网公开数据
标签:机器学习,深度学习,星系形态,分类,天文学,斯隆数字巡天,星系,科研,数据
数据概述:
本数据集包含来自斯隆数字巡天数据发布第7版(SDSS-DR7)的670,560个星系的形态分类结果。数据集提供了两类问题(0: 椭圆星系;或, 1: 螺旋星系)和三类问题(0: 椭圆星系, 1: 无棒螺旋星系, 或 2: 有棒螺旋星系)的分类。两类问题的分类结果通过传统机器学习方法(使用形态非参数参数和决策树)获得。三类问题的分类结果则通过卷积神经网络(CNN)获得。此外,数据集还提供了以下形态非参数参数:集中度(C),不对称度(A),平滑度(S),梯度模式分析(G2)参数以及熵(H)。数据集还包括CyMorph处理的误差信息。所有错误标志的映射如下:
- Error = 0: 成功(无错误)
- Error = 1: 星系2Rp范围内存在亮度显著的对象
- Error = 2: 无法计算星系的Rp
- Error = 3: 计算GPA时出现问题
- Error = 4: 计算H时出现问题
- Error = 5: 计算C时出现问题
- Error = 6: 计算A时出现问题
- Error = 7: 计算S时出现问题
数据用途概述:
该数据集适用于天文学教育和研究,特别是星系形态分类的研究。研究人员可以利用此数据集进行机器学习和深度学习算法的对比研究;教育工作者可以利用此数据集进行星系形态分类的教学和演示;天文学爱好者可以使用此数据集进行初步的数据探索和分析。数据集为星系形态分类领域的研究和教学提供了宝贵的数据支持。