用户行为序列推荐数据集UserBehaviorSequenceRecommendationDataset-lsscecilia
数据来源:互联网公开数据
标签:推荐系统,用户行为,序列建模,点击预测,机器学习,数据挖掘,用户画像,个性化推荐
数据概述:
该数据集包含用户在维基百科上的行为序列数据,记录了用户与维基百科页面之间的交互信息,适用于推荐系统模型的训练和评估。主要特征如下:
时间跨度:数据未明确标注时间范围,但基于数据结构推测为一段时间内的用户行为快照。
地理范围:数据来源于维基百科,涵盖全球范围内的用户行为数据。
数据维度:数据集包括用户ID、页面ID、时间戳、状态标签(可能表示用户行为类型,如点击、浏览等)以及一系列特征(comma_separated_list_of_features,可能是页面内容或其他用户相关属性的编码)。
数据格式:主要为CSV格式,文件名包括wikipedia.csv和ml_wikipedia.csv,此外还包含.pkl、.pth、.log和.npy等文件,其中CSV文件易于数据分析和处理,其他文件可能为模型参数、日志和中间结果等。
来源信息:数据来源于维基百科用户行为,已进行匿名化处理。
该数据集适合用于推荐系统、序列建模和用户行为分析等领域的研究。
数据用途概述:
该数据集具有广泛的应用潜力,特别适用于以下场景:
研究与分析:适用于推荐系统、序列建模、用户行为分析等领域的学术研究,如用户兴趣建模、点击预测、个性化推荐算法的开发与评估。
行业应用:可以为新闻推荐、电商推荐、内容推荐等行业提供数据支持,特别是在提升推荐准确率、优化用户体验方面。
决策支持:支持产品经理、运营人员进行用户行为分析,优化页面设计、内容推荐策略。
教育和培训:作为推荐系统、机器学习等课程的实训数据集,帮助学生和研究人员深入理解推荐系统的工作原理。
此数据集特别适合用于探索用户行为序列的规律,构建和评估推荐模型,从而优化推荐结果,提升用户粘性。