社交媒体成瘾与心理健康分析数据集SocialMediaAddictionandMentalHealthAnalysisDataset-jejejamal

社交媒体成瘾与心理健康分析数据集SocialMediaAddictionandMentalHealthAnalysisDataset-jejejamal

数据来源:互联网公开数据

标签:社交媒体, 成瘾行为, 心理健康, 文本分析, 自然语言处理, 情感分析, 机器学习, Reddit

数据概述: 该数据集包含来自Reddit社交媒体平台的数据,记录了与社交媒体成瘾和心理健康相关的用户帖子及其特征。主要特征如下: 时间跨度:数据来源于2019年。 地理范围:数据来源于Reddit平台,主要为英语用户生成的内容,未限定具体地理位置。 数据维度:数据集包括subreddit(子版块)、author(作者)、date(日期)、post(帖子内容)以及多种文本特征和心理学指标。文本特征包含自动可读性指数、Coleman-Liau指数、Flesch-Kincaid等级、Flesch阅读易读性、Gulpease指数、Gunning雾指数、LIX、SMOG指数、Wiener Sachtextformel、字符数、长词数量、单音节词数量、多音节词数量、句子数、音节数、唯一词数量、总词数,以及情感分析指标(负面、中性、正面情感得分,复合情感得分)。心理学指标包括经济压力、孤立感、物质使用、枪支、家庭压力、自杀倾向等评分,以及LIWC(语言查询与字数统计)分析结果,包括各种词汇类别的使用频率,如第一人称代词、第二人称代词、第三人称代词、成就、副词、情感过程、愤怒、焦虑等。此外,还包括基于TF-IDF(词频-逆文档频率)的关键词特征,用于捕捉帖子内容中的主题和关键概念。 数据格式:CSV格式,文件名为addiction_2019_features_tfidf_256.csv,方便数据分析和建模。 该数据集适合用于研究社交媒体使用与心理健康之间的关系,以及探索成瘾行为的语言特征。

数据用途概述: 该数据集具有广泛的应用潜力,特别适用于以下场景: 研究与分析:适用于心理学、社会学、传播学等领域的研究,例如分析社交媒体使用与心理健康之间的相关性、识别成瘾行为的语言模式、研究不同社交媒体平台的用户行为差异等。 行业应用:可以为社交媒体平台、心理健康服务机构提供数据支持,用于改进内容推荐算法、识别潜在的心理健康风险、开发针对性的干预措施等。 决策支持:支持政府部门、非营利组织等机构制定相关政策,例如规范社交媒体使用、改善公众心理健康等。 教育和培训:作为心理学、社会科学、数据科学等课程的实训数据,帮助学生和研究人员深入理解社交媒体对心理健康的影响,并掌握数据分析和机器学习技术。 此数据集特别适合用于探索社交媒体使用与心理健康之间的复杂关系,例如识别高风险用户、预测成瘾行为、评估干预措施的有效性,以及深入理解与成瘾相关的语言模式和情感表达。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 1.22 MiB
最后更新 2025年5月19日
创建于 2025年5月19日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。