化妆产品客户评价数据集

化妆产品客户评价数据集 数据来源:互联网公开数据
标签:化妆品,客户评价,推荐系统,机器学习,情感分析,产品分析,用户反馈,消费趋势

数据概述:
本数据集由Luxxify Makeup提供,是一个全面的化妆品产品和客户评价数据集,旨在支持化妆品产品推荐系统的研究与开发。数据集分为两个主要部分:
1. 产品信息文件:包含详尽的化妆品产品信息,如产品名称、品牌、价格、类别等,为理解客户评价提供了背景支持。
2. 客户评价文件:涵盖用户对产品的详细反馈,包括评价内容、评分、有用性投票、地理位置等,为深入分析客户体验提供了丰富的数据基础。

数据用途概述:
该数据集适用于多种场景,包括但不限于:
- 机器学习模型开发:利用产品信息和客户评价数据训练个性化推荐系统,为用户提供基于个人偏好的化妆品推荐。
- 情感分析:通过分析评价中的情感倾向,了解客户对产品的满意度,帮助品牌识别改进方向。
- 趋势分析:通过对评价数据的时间序列分析,识别流行产品和成分,为品牌调整产品策略提供依据。
- 用户体验研究:研究用户反馈,了解不同产品类别和品牌在市场上的表现,为品牌和零售商提供决策支持。
- 市场研究:分析不同地区、不同消费群体的偏好,为市场策略制定提供数据支持。
- 教育与研究:适用于机器学习、数据挖掘和推荐系统相关课程的教学和研究,帮助学习者理解实际场景中的数据应用。

数据特征概览:
- 产品信息文件字段定义:
- product_link_id: 整型,产品链接唯一标识符。
- product_link: 文本,产品网页链接。
- category: 文本,产品类别(如化妆品、护肤品)。
- item_id: 整型,产品唯一标识符。
- product_name: 文本,产品名称。
- brand: 文本,产品品牌。
- price: 数值,产品价格(以货币单位表示)。
- num_shades: 整型,产品可选色号数量。
- rating: 数值,产品总体平均评分。
- num_reviews: 整型,产品总评价数。
- description: 文本,产品详细描述。
- pros: 文本,产品优点或益处列表。
- cons: 文本,产品缺点或负面反馈列表。
- best_uses: 文本,产品最佳使用场景或推荐用途。
- describe_yourself: 文本,用户人口统计或特征描述。
- review_star_1review_star_5: 整型,各星级评分数量(1星至5星)。
- rating_star_1rating_star_5: 整型,基于产品质量的各星级评分数量(1星至5星)。
- rating_count: 整型,基于产品质量的总评分数量。
- review_count: 整型,用户评价总数。
- average_rating: 数值,产品平均评分。
- recommended_ratio: 数值,推荐产品的用户比例。
- native_review_count: 整型,平台原生评价数量。
- native_sampling_review_count: 整型,基于样本的原生评价数量。
- native_community_content_review_count: 整型,社区贡献的评价数量。
- syndicated_review_count: 整型,来自外部来源的评价数量。
- faceoff_negative: 文本,主要负面反馈总结。
- faceoff_positive: 文本,主要正面反馈总结。

  • 客户评价文件字段定义:
  • unique_review_id: 大整型,评价唯一标识符。
  • product_link_id: 整型,与产品链接对应的标识符。
  • review_id: 大整型,评价唯一标识符。
  • type: 文本,评价类型(如正面、负面、中性)。
  • id: 文本,评价的唯一标识码。
  • ugc_id: 文本,用户生成内容的标识符。
  • legacy_id: 文本,旧系统的遗留评价标识符。
  • internal_review_id: 大整型,内部系统评价标识符。
  • headline: 文本,评价标题或摘要。
  • nickname: 文本,评价者昵称或化名。
  • created_date: 带时区的时间戳,评价创建时间。
  • updated_date: 带时区的时间戳,评价最后更新时间。
  • rating: 整型,产品评分(1至5星)。
  • helpful_votes: 整型,认为评价有用的人数。
  • not_helpful_votes: 整型,认为评价无用的人数。
  • uri: 文本,评价链接。
  • comments: 文本,评价全文内容或评论。
  • locale: 文本,评价的语言区域。
  • location: 文本,评价者的地理位置。
  • bottom_line: 文本,评价总结或结论。
  • product_page_id: 文本,产品页面标识符。
  • upc: 文本,产品通用产品代码(UPC)。
  • gtin: 文本,全球贸易项目编号(GTIN)。
  • is_staff_reviewer: 布尔值,标识评价者是否为工作人员。
  • is_verified_buyer: 布尔值,标识评价者是否为验证购买者。
  • is_verified_reviewer: 布尔值,标识评价者是否被平台验证。
  • helpful_score: 整型,基于有用性投票和评价质量的计算得分。

数据价值:
该数据集提供了丰富的化妆品市场洞察,涵盖了产品特征、客户反馈和用户行为信息。适用于机器学习建模、情感分析、趋势研究和市场策略制定等场景,为化妆品行业的研究和业务决策提供有力支持。

获取方式:
该数据集可以从Kaggle等公开数据平台下载,具体访问链接请参考相关说明或文档。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 18.5 MiB
最后更新 2025年4月24日
创建于 2025年4月24日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。