百万美元艺术品市场数据集2018-2022
数据来源:互联网公开数据
标签:艺术品市场,百万美元,高价值艺术品,艺术家,投资,市场分析,机器学习
数据概述:
本数据集汇集了2018年至2022年间价值超过100万美元的艺术品数据,来源于Masterworks网站,并补充了苏富比洞察报告《百万美元艺术品市场》中的顶级艺术家销售信息。数据涵盖了多位知名艺术家的作品,包括毕加索、莫奈、安迪·沃霍尔、让-米歇尔·巴斯奎特、格哈德·里希特、大卫·霍克尼、弗朗西斯·培根、赵无极和马克·罗斯科等。
数据用途概述:
该数据集适用于市场分析、机器学习任务、艺术品投资与估值等场景。研究人员可以通过比较购买与销售价格,评估投资回报率(ROI);探索不同媒介与销售价格之间的关联性;利用图像URL进行图像相关项目,如生成特定艺术家风格的作品或训练分类模型;进行时间序列分析和聚类分析以发现潜在模式;评估艺术家表现、投资回报率和市场趋势等。
数据内容:
数据集包含每个艺术家的单独CSV文件,文件夹名为“artworks 1m above”。每个CSV文件包含艺术品的标题、艺术家、描述、购买价格、销售价格、增长倍数、增长期间、URL、是否有图像以及图像URL等字段。
示例数据:
示例数据来自artworks_piccaso4.csv文件中的一行数据。
注意事项:
- 数据覆盖有限,仅包含来自Masterworks的部分作品,因此不是这些艺术家作品或销售的完整列表。
- 价格可能不完全准确,购买和销售价格反映自网站数据,可能不始终代表最终落锤价格或净金额。
- 部分艺术家(如勒内·马格里特)的数据缺失,未来的更新可能会添加更多数据。
- 价格以美元表示,尽管原始销售可能以其他货币进行。时间(如“9年”)是基于首次购买到最终销售的近似值。
数据使用:
- 市场分析:比较购买与销售价格,评估投资回报率;探索不同媒介与销售价格之间的关联性。
- 机器学习/数据科学:利用图像URL进行图像相关项目,如生成特定艺术家风格的作品或训练分类模型;进行时间序列分析和聚类分析以发现潜在模式。
- 艺术品投资与估值:利用历史购买和销售数据评估某些艺术家是否能提供更好的回报;评估持有期,评估短期与长期持有是否产生不同的投资回报率模式。
数据获取方式:
数据可以从Masterworks网站获取,艺术家信息来源于苏富比洞察报告。
许可与致谢:
数据来源:
- 艺术品详情来自Masterworks。
- 价值超过100万美元的顶级艺术家来自苏富比洞察报告《百万美元艺术品市场》(2018-2022)。
- 使用条款:仅限教育和研究使用,不提供保修。
- 致谢:感谢Masterworks提供的公开数据页面,以及苏富比提供的顶级10艺术家数据。
联系/反馈:
如果您对数据集有任何问题或建议,请在Kaggle评论中留言或打开讨论线程。欢迎贡献(例如,添加更多艺术家或更新拍卖结果)。
技术细节:
- 文件格式:CSV
- 大小:多个文件,每个艺术家一个文件
- 分辨率:通过URL提供图像
- 依赖项:基本数据分析不需要任何依赖项
数据处理:
数据从Masterworks.com的研究部分抓取,每个艺术家的作品从其研究页面收集。数据代表了其总销售额的一部分,重点关注具有完整交易信息的已记录销售。