蘑菇可食用性及特征数据集
数据来源:互联网公开数据
标签:蘑菇,食用性,分类,特征,生物学,机器学习,数据分析
数据概述:
本数据集包含关于蘑菇的分类特征数据,用于预测蘑菇是否可食用。数据集包含一个二元分类的标签,标记蘑菇是否可食用(“e”代表可食用,“p”代表有毒,其中“p”也包含食用性未知的蘑菇)。此外,数据集还包含20个描述蘑菇形态特征的变量,这些变量包括标称型(n)和度量型(m)两种类型。
数据用途概述:
该数据集可用于蘑菇分类、食用性预测、生物学研究、机器学习模型训练等多种场景。研究人员可以利用该数据开发和评估蘑菇识别算法,帮助识别有毒蘑菇,减少误食风险。同时,该数据集也适合用于教育目的,例如教授机器学习模型构建、数据分析和模式识别。
数据集字段定义:
- cap-diameter (m):菌盖直径,浮点数,单位为厘米。
- cap-shape (n):菌盖形状,bell=b(钟形),conical=c(锥形),convex=x(凸形),flat=f(扁平),sunken=s(下凹),spherical=p(球形),others=o(其他)。
- cap-surface (n):菌盖表面,fibrous=i(纤维状),grooves=g(有沟),scaly=y(鳞片状),smooth=s(光滑),shiny=h(有光泽),leathery=l(皮革状),silky=k(丝状),sticky=t(粘性),wrinkled=w(皱纹),fleshy=e(肉质)。
- cap-color (n):菌盖颜色,brown=n(棕色),buff=b(浅褐色),gray=g(灰色),green=r(绿色),pink=p(粉色),purple=u(紫色),red=e(红色),white=w(白色),yellow=y(黄色),blue=l(蓝色),orange=o(橙色),black=k(黑色)。
- does-bruise-bleed (n):是否变色或流血,bruises-or-bleeding=t(是),no=f(否)。
- gill-attachment (n):菌褶附着方式,adnate=a(相连),adnexed=x(近相连),decurrent=d(延生),free=e(离生),sinuate=s(弯生),pores=p(孔状),none=f(无),unknown=?(未知)。
- gill-spacing (n):菌褶间距,close=c(密集),distant=d(稀疏),none=f(无)。
- gill-color (n):菌褶颜色,同cap-color,加上none=f(无)。
- stem-height (m):菌柄高度,浮点数,单位为厘米。
- stem-width (m):菌柄宽度,浮点数,单位为毫米。
- stem-root (n):菌柄根部,bulbous=b(球状),swollen=s(膨胀),club=c(棒状),cup=u(杯状),equal=e(等粗),rhizomorphs=z(菌索状),rooted=r(有根)。
- stem-surface (n):菌柄表面,同cap-surface,加上none=f(无)。
- stem-color (n):菌柄颜色,同cap-color,加上none=f(无)。
- veil-type (n):菌幕类型,partial=p(部分),universal=u(全包)。
- veil-color (n):菌幕颜色,同cap-color,加上none=f(无)。
- has-ring (n):是否有菌环,ring=t(有),none=f(无)。
- ring-type (n):菌环类型,cobwebby=c(蛛网状),evanescent=e(易消失),flaring=r(展开),grooved=g(有沟),large=l(大),pendant=p(下垂),sheathing=s(套状),zone=z(带状),scaly=y(鳞片状),movable=m(可移动),none=f(无),unknown=?(未知)。
- spore-print-color (n):孢子印颜色,同cap color。
- habitat (n):栖息地,grasses=g(草地),leaves=l(落叶),meadows=m(草甸),paths=p(小路),heaths=h(荒地),urban=u(城市),waste=w(垃圾堆),woods=d(森林)。
- season (n):季节,spring=s(春季),summer=u(夏季),autumn=a(秋季),winter=w(冬季)。