葡萄牙葡萄酒品质研究数据集-2009-futurezz
数据来源:互联网公开数据
标签:葡萄酒,品质,数据集,葡萄牙,物理化学,感官评价,数据分析,回归预测
数据概述:
本数据集包含葡萄牙“Vinho Verde”葡萄酒的红葡萄酒和白葡萄酒样品品质数据。数据集分为两个文件,红葡萄酒包含1599个样本,白葡萄酒包含4898个样本。每个样本包括11个物理化学属性(输入变量)和1个感官品质分数(输出变量)。物理化学属性包括固定酸度、挥发性酸度、柠檬酸、残糖、氯化物、游离二氧化硫、总二氧化硫、密度、pH值、硫酸盐和酒精含量。感官品质分数由至少3位葡萄酒专家评估得出,分数范围为0(非常差)到10(非常好)。数据集适用于葡萄酒品质建模、分类或回归分析等多种场景。
数据用途概述:
该数据集适用于葡萄酒品质建模、分类或回归分析、特征选择、异常检测等研究场景。研究人员可以使用该数据集训练回归模型,评估不同物理化学属性对葡萄酒品质的影响;也可以进行特征选择,识别对品质预测影响最大的属性。此外,数据集还适用于葡萄酒品质分类研究,通过异常检测算法识别特别优质或劣质的葡萄酒样品。对于葡萄酒产业和研究机构而言,该数据集是进行品质分析和优化的重要参考资料。
数据集引用请求:
请在使用本数据集时引用以下文献:
P. Cortez, A. Cerdeira, F. Almeida, T. Matos 和 J. Reis. 通过数据挖掘从物理化学性质建模葡萄酒偏好. 在《决策支持系统》, Elsevier, 47(4):547-553. ISSN: 0167-9236.
可用资源:
[@Elsevier] http://dx.doi.org/10.1016/j.dss.2009.05.016
[Pre-press (pdf)] http://www3.dsi.uminho.pt/pcortez/winequality09.pdf
[bib] http://www3.dsi.uminho.pt/pcortez/dss09.bib