数据集概述
该数据集包含对Twitter公民科学社区中可持续发展目标(SDGs)、电子学习及电子健康讨论的分析结果,为复现相关研究成果提供基础。数据经匿名处理,不含个人隐私信息,涵盖主题分布、话题网络、高频标签及用户互动等多维度分析内容。
文件详解
- 可持续发展目标(SDGs)分析文件:
- dominant_topics_anonym.xlsx:Excel文件,含SDGs讨论中的主要话题分布数据
- sdgs_count_publish.csv:CSV文件,含各SDGs相关推文数量统计
- sdgs_tweets_sdgsaccess.xlsx:Excel文件,与sdgs_count_publish.csv内容一致,便于Excel处理
- topics_tweets_sdgsaccess.xlsx:Excel文件,含SDGs讨论中通过机器学习提取的主题分类推文数据
- ldavis_prepared_ieee17.html:HTML文件,含SDGs讨论主题建模的主题间距离图及显著术语
- 电子健康(eHealth)分析文件:
- hashtags_treemap_health.xlsx:Excel文件,含电子健康分析中的高频标签统计
- top_hash_health.xlsx:Excel文件,含电子健康讨论中的最常用标签数据
- Most_retweeted_accounts.xlsx:Excel文件,含电子健康讨论中被转发最多的前20个用户数据,含入度(被转发数)、出度(转发数)字段
- Most_retweeting_account.xlsx:Excel文件,含电子健康讨论中转发最多的用户数据,含入度、出度字段
- 电子学习(eLearning)分析文件:
- hashtags.csv:CSV文件,含电子学习分析中的最常用标签统计结果
- 话题网络分析文件:
- Edges_Hashtag_connected.csv:CSV文件,含构建标签关联网络的边数据,可用于网络构建与统计分析
适用场景
- 社交媒体内容分析:研究Twitter平台上公民科学社区对SDGs、电子健康及电子学习的讨论特征
- 话题网络研究:基于标签关联数据构建网络,分析话题间的关联模式
- 可持续发展传播研究:探索SDGs相关内容在社交媒体中的传播规律与用户参与度
- 电子健康传播分析:分析电子健康话题在公民科学社区中的讨论热点及用户互动行为
- 学术成果复现:为相关研究提供可复现的分析数据基础