Reddit用户MBTI人格类型与数字足迹数据集-2021-michaelkitchener

Reddit用户MBTI人格类型与数字足迹数据集-2021-michaelkitchener 数据来源:互联网公开数据 标签:MBTI,人格类型,Reddit,数字足迹,社交网络分析,用户行为,数据挖掘,分类模型

数据概述: 本数据集包含匿名Reddit用户的MBTI人格类型信息及其在各个子版块中的发帖和评论频率。每个数据行代表一个用户的MBTI人格类型,而每个数据列则表示用户在特定子版块中的发帖或评论数量。具体而言,“posts_examplesubreddit”表示该用户所有时间内的前100篇帖子中有多少篇在“r/examplesubreddit”子版块中,“comments_examplesubreddit”表示该用户最近的100条评论中有多少条在“r/examplesubreddit”子版块中。

数据集通过使用PRAW(Reddit的Python API封装器)抓取了在r/mbti子版块中评论的用户及其自我标识的MBTI人格类型(通常在他们的 flair 中显示)。对于每个已知MBTI人格类型的用户,数据集进一步记录了他们前100篇帖子和最近100条评论中在各个子版块的互动频率,从而构建了一个用户足迹矩阵。

数据用途概述: 该数据集适用于研究MBTI人格类型(或特定人格特质,如外向性 vs 内向性)是否可以通过用户的子版块互动来预测。通过对该数据集的分析,可以开发出有效的分类模型来预测用户的外向性、内向性等人格特质。值得注意的是,MBTI人格类型测试具有争议性,一些人认为它并不完全可靠。然而,外向性/内向性和感知/直觉与大五人格模型中的外向性和开放性高度相关。因此,利用数据集重点尝试预测这些特质可能是更为合理的选择。

注意事项: MBTI人格类型测试存在争议,部分人士认为其不具科学性。然而,外向性/内向性和感知/直觉在大五人格模型中对应于外向性和开放性,具有较高的相关性。因此,研究时建议重点关注这些特质的预测。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 0.74 MiB
最后更新 2025年4月22日
创建于 2025年4月22日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。