商品搜索相关性数据集ProductSearchRelevanceDataset-ishitakumar2109
数据来源:互联网公开数据
标签:搜索推荐, 文本匹配, 电商数据, 语义分析, 多语言, 机器学习, 商品搜索, 用户行为
数据概述:
该数据集包含来自电商平台的用户搜索查询与商品信息,记录了用户搜索行为与商品之间的关联性。主要特征如下:
时间跨度:数据未明确标注时间,可视为静态数据集,反映用户搜索与商品匹配关系。
地理范围:数据来源于全球电商平台,涵盖不同地区的用户搜索行为。
数据维度:数据集包括“query_id”(查询ID)、“query”(用户搜索查询文本)、“query_locale”(查询语言/地区)、“product_id”(商品ID)以及训练集中的“esci_label”(相关性标签)。
数据格式:提供CSV格式,包含train-v0.3.csv(训练集)、test_public-v0.3.csv(测试集)以及product_catalogue-v0.3.csv(商品目录,未在样例数据中体现)三个文件,方便数据分析和模型构建。
来源信息:数据来源于电商平台,已进行匿名处理和脱敏。
该数据集适合用于搜索相关性分析、商品推荐、文本匹配和多语言搜索等研究。
数据用途概述:
该数据集具有广泛的应用潜力,特别适用于以下场景:
研究与分析:适用于自然语言处理、信息检索和机器学习交叉领域的学术研究,如搜索意图识别、相关性排序、跨语言搜索等。
行业应用:为电商平台、搜索引擎等提供数据支持,可用于提升商品搜索质量、优化推荐系统、改进用户体验。
决策支持:支持电商平台的运营决策,如改进商品标题、优化关键词、调整商品排序策略。
教育和培训:作为自然语言处理、信息检索、机器学习等相关课程的实训数据,帮助学生理解搜索相关性分析和构建推荐系统。
此数据集特别适合用于探索用户搜索行为与商品之间的关联性,帮助用户构建更智能、更精准的商品推荐和搜索系统,提升用户满意度。