社交媒体个人身份信息披露分析数据集2021-2022

社交媒体个人身份信息披露分析数据集2021-2022 数据来源:互联网公开数据 标签:社交媒体,个人身份信息,隐私,影响力,数据分析,网络社区,信息共享 数据概述: 本数据集来源于一项关于社交媒体对话中个人身份信息(PII)披露的研究,特别关注了在互动中影响者的特征。数据集包括两个部分:推特(Twitter)和Reddit的数据,分别用于初步分析和主研究。数据集中的每个文件夹均包含按趋势或收集日期划分的已分析帖子和聚类摘要的CSV文件。原始数据未提供,以保护原始作者的身份。数据集记录了帖子和聚类的关键信息,包括节点ID、用户ID、影响力、披露的PII类型及风险评分等,适用于分析社交媒体中PII的披露模式和影响者的角色。 数据用途概述: 该数据集适用于隐私保护研究、社交媒体影响者分析、个人数据共享模式研究等多个场景。研究人员可以利用此数据集探索社交媒体中的隐私与社会资本之间的关系;企业可以了解用户在社交媒体上的数据分享行为,以制定相应的隐私保护策略;政策制定者则可以借助数据评估相关法规的有效性。 举例: 数据集中的一个示例帖子可能包含以下信息:节点ID、用户ID、影响力评分、是否披露了个人身份信息、帖子中的PII类型及风险评分等。例如,某个帖子的节点ID为“123e4567-e89b-12d3-a456-426614174000”,用户ID为“abcd1234-abcd-abcd-abcd-abcd1234abcd”,影响力评分为0.85,披露了个人身份信息,帖子中的PII类型包括电子邮件地址,风险评分为2.5。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 28.35 MiB
最后更新 2025年4月18日
创建于 2025年4月18日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。