亚马逊多语言购物会话数据集

亚马逊多语言购物会话数据集 数据来源:互联网公开数据
标签:多语言,购物会话,亚马逊ASIN,电子商务,自然语言处理,多语言模型训练

数据概述:
本数据集是由亚马逊发布的多语言购物会话数据集,包含来自六个不同语言和地区的客户会话记录:英语(英国)、德语、日语、法语、意大利语和西班牙语。数据集分为训练集、阶段1测试集和阶段2测试集,适用于三种不同的任务目标。训练集包含所有语言的共同数据,而测试集根据任务目标不同,分别使用特定语言的数据。数据集中的用户会话记录了用户与产品之间的交互行为,包括用户浏览的产品及其属性信息,如产品标题、价格、品牌、颜色、尺寸等。

数据用途概述:
该数据集适用于多种多语言购物场景的研究与应用。研究人员可利用数据集进行跨语言推荐系统开发、多语言自然语言处理模型训练、购物行为分析等。例如,任务1和任务2分别针对特定语言组合,支持跨语言迁移学习的研究;任务3则关注产品标题生成任务,支持基于用户会话的产品推荐与预测。此外,数据集还为电子商务领域的多语言模型开发提供了高质量的训练和测试基准,有助于提升跨语言购物体验和个性化推荐能力。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 452.01 MiB
最后更新 2025年6月1日
创建于 2025年6月1日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。