时互联网性别预测数据集-2021

时互联网性别预测数据集-2021 数据来源:互联网公开数据 标签:性别识别,机器学习,市场营销,用户行为,内容消费,数据分析,预测模型

数据概述: 本数据集来源于TechGig举办的ColombiaOnline黑客马拉松,旨在解决基于数字内容阅读模式的自动性别识别问题。数据集包含时互联网有限公司(Times Internet Limited)平台上用户的浏览行为数据,通过分析用户访问的内容,预测用户的性别。该数据集适用于市场营销、用户行为分析、机器学习模型训练等场景。数据集分为训练集和测试集,分别用于模型训练和结果验证。

数据集包括以下文件: - UserIdToUrl.zip:用户访问的URL列表 - Urls_Json_Data.zip:URL的详细信息 - UserIdToGender_Train.csv:用户性别训练数据,包含用户ID和性别 - UserId_Test.csv:用户性别测试数据,包含用户ID - sample_submission.csv:提交结果的样本文件

字段说明: - userid:用户ID - gender:性别 - url:内容URL - title:内容标题 - description:内容简短描述 - long_description:内容详细描述 - alt_titles:内容的替代标题 - brand:内容品牌名称 - language:内容语言

数据用途概述: 该数据集适用于市场营销策略制定、用户行为分析、个性化推荐系统开发等多种场景。营销人员可以通过分析用户性别特征,制定更有针对性的营销策略;数据科学家可以利用该数据集训练性别预测模型,提升广告投放的精准度;研究者则可以利用该数据集探讨性别差异在内容消费中的表现,为内容提供商提供参考。数据集对提升广告效果、优化用户体验具有重要意义。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 300.9 MiB
最后更新 2025年5月5日
创建于 2025年5月5日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。