化妆产品客户评价数据集
数据来源:互联网公开数据
标签:化妆品,客户评价,推荐系统,机器学习,情感分析,产品分析,用户反馈,消费趋势
数据概述:
本数据集由Luxxify Makeup提供,是一个全面的化妆品产品和客户评价数据集,旨在支持化妆品产品推荐系统的研究与开发。数据集分为两个主要部分:
1. 产品信息文件:包含详尽的化妆品产品信息,如产品名称、品牌、价格、类别等,为理解客户评价提供了背景支持。
2. 客户评价文件:涵盖用户对产品的详细反馈,包括评价内容、评分、有用性投票、地理位置等,为深入分析客户体验提供了丰富的数据基础。
数据用途概述:
该数据集适用于多种场景,包括但不限于:
- 机器学习模型开发:利用产品信息和客户评价数据训练个性化推荐系统,为用户提供基于个人偏好的化妆品推荐。
- 情感分析:通过分析评价中的情感倾向,了解客户对产品的满意度,帮助品牌识别改进方向。
- 趋势分析:通过对评价数据的时间序列分析,识别流行产品和成分,为品牌调整产品策略提供依据。
- 用户体验研究:研究用户反馈,了解不同产品类别和品牌在市场上的表现,为品牌和零售商提供决策支持。
- 市场研究:分析不同地区、不同消费群体的偏好,为市场策略制定提供数据支持。
- 教育与研究:适用于机器学习、数据挖掘和推荐系统相关课程的教学和研究,帮助学习者理解实际场景中的数据应用。
数据特征概览:
- 产品信息文件字段定义:
- product_link_id
: 整型,产品链接唯一标识符。
- product_link
: 文本,产品网页链接。
- category
: 文本,产品类别(如化妆品、护肤品)。
- item_id
: 整型,产品唯一标识符。
- product_name
: 文本,产品名称。
- brand
: 文本,产品品牌。
- price
: 数值,产品价格(以货币单位表示)。
- num_shades
: 整型,产品可选色号数量。
- rating
: 数值,产品总体平均评分。
- num_reviews
: 整型,产品总评价数。
- description
: 文本,产品详细描述。
- pros
: 文本,产品优点或益处列表。
- cons
: 文本,产品缺点或负面反馈列表。
- best_uses
: 文本,产品最佳使用场景或推荐用途。
- describe_yourself
: 文本,用户人口统计或特征描述。
- review_star_1
至review_star_5
: 整型,各星级评分数量(1星至5星)。
- rating_star_1
至rating_star_5
: 整型,基于产品质量的各星级评分数量(1星至5星)。
- rating_count
: 整型,基于产品质量的总评分数量。
- review_count
: 整型,用户评价总数。
- average_rating
: 数值,产品平均评分。
- recommended_ratio
: 数值,推荐产品的用户比例。
- native_review_count
: 整型,平台原生评价数量。
- native_sampling_review_count
: 整型,基于样本的原生评价数量。
- native_community_content_review_count
: 整型,社区贡献的评价数量。
- syndicated_review_count
: 整型,来自外部来源的评价数量。
- faceoff_negative
: 文本,主要负面反馈总结。
- faceoff_positive
: 文本,主要正面反馈总结。
- 客户评价文件字段定义:
unique_review_id
: 大整型,评价唯一标识符。
product_link_id
: 整型,与产品链接对应的标识符。
review_id
: 大整型,评价唯一标识符。
type
: 文本,评价类型(如正面、负面、中性)。
id
: 文本,评价的唯一标识码。
ugc_id
: 文本,用户生成内容的标识符。
legacy_id
: 文本,旧系统的遗留评价标识符。
internal_review_id
: 大整型,内部系统评价标识符。
headline
: 文本,评价标题或摘要。
nickname
: 文本,评价者昵称或化名。
created_date
: 带时区的时间戳,评价创建时间。
updated_date
: 带时区的时间戳,评价最后更新时间。
rating
: 整型,产品评分(1至5星)。
helpful_votes
: 整型,认为评价有用的人数。
not_helpful_votes
: 整型,认为评价无用的人数。
uri
: 文本,评价链接。
comments
: 文本,评价全文内容或评论。
locale
: 文本,评价的语言区域。
location
: 文本,评价者的地理位置。
bottom_line
: 文本,评价总结或结论。
product_page_id
: 文本,产品页面标识符。
upc
: 文本,产品通用产品代码(UPC)。
gtin
: 文本,全球贸易项目编号(GTIN)。
is_staff_reviewer
: 布尔值,标识评价者是否为工作人员。
is_verified_buyer
: 布尔值,标识评价者是否为验证购买者。
is_verified_reviewer
: 布尔值,标识评价者是否被平台验证。
helpful_score
: 整型,基于有用性投票和评价质量的计算得分。
数据价值:
该数据集提供了丰富的化妆品市场洞察,涵盖了产品特征、客户反馈和用户行为信息。适用于机器学习建模、情感分析、趋势研究和市场策略制定等场景,为化妆品行业的研究和业务决策提供有力支持。
获取方式:
该数据集可以从Kaggle等公开数据平台下载,具体访问链接请参考相关说明或文档。