珠宝交易分析用钻石价格与品质指标数据集

数据概述:

本数据集包含53,940条钻石的价格记录,每条记录包含10个属性,其中1个属性为目标变量,即钻石的价格。这些属性详细描述了每颗钻石的特征,包括:

  1. carat(克拉):钻石的重量,是决定钻石价格的关键因素之一。
  2. cut(切工):钻石的切工等级,分为“Fair”(较差)、“Good”(良好)、“Very Good”(非常好)、“Premium”(优质)和“Ideal”(完美)。
  3. color(颜色):钻石的颜色等级,从“D”(无色)到“J”(带有轻微黄色)。
  4. clarity(净度):钻石的净度等级,从“I1”(包含肉眼可见的瑕疵)到“IF”(内部无瑕)。
  5. depth(深度):钻石的深度百分比,表示钻石台面到底部的距离占平均直径的百分比。
  6. table(桌面):钻石桌面的宽度百分比,表示桌面宽度占平均直径的百分比。
  7. price(价格):钻石的价格,单位为美元,为数据集的目标变量。
  8. x(长度):钻石的长度(毫米)。
  9. y(宽度):钻石的宽度(毫米)。
  10. z(高度):钻石的高度(毫米)。

数据集中的每条记录均代表一颗钻石,涵盖了钻石的物理特征、品质等级以及价格信息,为研究钻石价值评估提供了全面的数据支持。

数据用途概述:

该数据集适用于钻石价格预测、机器学习建模、回归分析等多种场景。研究人员可以利用此数据集构建预测模型,分析影响钻石价格的主要因素;商业机构可以基于模型优化钻石定价策略;数据科学家可将其用于教学和研究,探索回归分析算法的性能表现。此外,数据集也适合用于数据挖掘和商业决策,帮助用户理解钻石市场的定价逻辑和市场趋势。

packageimg

数据与资源

附加信息

字段
数据集大小 0.69 MiB
最后更新 2025年6月18日
创建于 2025年6月18日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。