-
Twitter仇恨言论检测与分析数据集
数据集概述 该数据集包含用于Twitter仇恨言论检测与分析研究的两个语料库:2017年2月至12月收集的200万条原始推文,以及6000条标注是否包含仇恨内容的推文,为相关研究提供数据支持。 文件详解 文件名称:labeled_corpus_6K.txt 文件格式:TXT(.txt)...
-
加泰罗尼亚公共图书馆社交媒体与博客档案数据集2020年4月
数据集概述 本数据集包含2020年4月更新的加泰罗尼亚公共图书馆社交媒体及博客档案信息,覆盖图书馆、阅读空间、服务点、流动图书馆等共五百零七个服务点,记录其社交媒体账号及博客链接等信息。 文件详解 数据文件(三种格式):...
-
视觉虚假信息数据集
数据集概述 该数据集是针对宣传、谣言和假新闻三类视觉虚假信息的精选数据集,包含描述文档和图片链接文件,为视觉虚假信息的识别与分析提供数据支持。 文件详解 文件名称: Dataset description.pdf 文件格式: PDF 内容说明: 详细记录数据集的来源信息及相关背景介绍 文件名称: Sources.xlsx 文件格式: XLSX...
-
Twitter公民科学社区可持续发展目标与电子健康分析数据集
数据集概述 该数据集包含对Twitter公民科学社区中可持续发展目标(SDGs)、电子学习及电子健康讨论的分析结果,为复现相关研究成果提供基础。数据经匿名处理,不含个人隐私信息,涵盖主题分布、话题网络、高频标签及用户互动等多维度分析内容。 文件详解 可持续发展目标(SDGs)分析文件:...
-
CMU_MisCov19新冠疫情Twitter错误信息特征数据集
数据集概述 该数据集为针对新冠疫情相关Twitter错误信息的标注数据集,包含四千五百七十三条标注推文,覆盖十七个主题,同时提供标注编码手册,用于错误信息检测与特征分析研究。 文件详解 文件名称:COVID_19_Twitter_Misinformation_Codebook.pdf 文件格式:PDF...
-
社交媒体气候安全原始与处理数据集2014_2023
数据集概述 本数据集涵盖2014年1月至2023年5月期间Twitter平台上与气候安全相关的对话数据,包含原始及处理后的多类型文件,为研究社交媒体中气候安全议题的传播提供支持。 文件详解 文档与说明文件: readme.pdf:PDF格式,提供数据集相关说明文档...
-
精英Twitter极化数据集2010_2021
数据集概述 本数据集包含2010年1月1日至2021年12月31日期间9位全球知名公众人物的Twitter活动标注数据,涵盖原创推文和转推,包含情感评分、极化分类及主题分配等信息,覆盖政治、商业、体育等多元领域。 文件详解 该数据集以压缩包形式存储,按人物划分目录,每个目录包含两个Excel文件,具体说明如下: - 压缩包文件:Elite...
-
西班牙主要政党Twitter毒性水平分析数据集2015_2023
数据集概述 该数据集聚焦2015至2023年西班牙主要政党在Twitter平台的内容分析,核心为各政党相关推文的毒性水平研究,提供该主题的研究材料压缩包。 文件详解 文件名称:Analizando los niveles de toxicidad de los principales partidos politicos españoles en...
-
西班牙与葡萄牙八座山地公园社交媒体数据集2015_2022
数据集概述 本数据集包含2015至2022年间从Flickr和Twitter/X平台获取的八座西班牙与葡萄牙山地国家公园的地理标记照片及元数据,经人工智能模型和专家标注处理,为相关研究提供基础数据支持。 文件详解 数据库元数据文件:...
-
Twitter交通信息系统开发用带交通标签推文数据集
数据集概述 本数据集包含通过Twitter搜索API收集的推文,每条推文被标注为非交通(NT)、交通事件(TI)、交通状况与信息(TCI)三类,同时提供交通相关(TI+TCI)与非相关(NT)的二分类版本,支持交通信息系统的开发。 文件详解 3分类数据集文件:...
-
豪萨语情感标注推文多标签情感分类数据集
数据集概述 该数据集包含一万九千七百五十七条豪萨语推文,每条标注十一种情感(愤怒、悲伤、厌恶、恐惧、惊讶、喜悦、信任、乐观、悲观、期待、中性),用于多标签情感分类任务,填补低资源语言自然语言处理领域空白,支持复杂情感检测模型训练。 文件详解 文件名称: HaEmoC_V1.csv 文件格式: CSV 字段映射: ID:...
-
基于主题的英文维基百科与推特用户数据集
数据集概述 本数据集收集自英文维基百科与推特平台,包含经预处理的维基百科文章文本及推特用户数据。预处理步骤包括词形还原、俚语转换为标准英语、去除停用词,以及维基百科标记语言处理,最终生成纯文本格式内容。 文件详解 文件名称: Wiki_En.rar 文件格式: RAR压缩包 (.rar) 内容说明:...
-
社交媒体情感分析Twitter推文数据集-2023年
社交媒体情感分析Twitter推文数据集-2023年 数据来源:互联网公开数据 标签:Twitter,推文,情感分析,社交媒体,文本数据,自然语言处理,机器学习,舆情分析 数据概述:...
-
社交媒体土耳其推特用户行为分析数据集
社交媒体土耳其推特用户行为分析数据集_Social_Media_Turkish_Twitter_User_Behavior_Analysis 数据来源:互联网公开数据 标签:社交媒体, Twitter, 用户行为分析, 文本分析, 情感分析, 话题标签, 政治, 社交网络 数据概述:...
-
英国脱欧社交媒体观点分析数据集
英国脱欧社交媒体观点分析数据集_Brexit_Social_Media_Sentiment_Analysis 数据来源:互联网公开数据 标签:脱欧, 社交媒体, 情感分析, 舆情分析, 文本挖掘, 观点挖掘, Twitter, 自然语言处理 数据概述:...
-
美国大选社交媒体推文分析数据集
美国大选社交媒体推文分析数据集_US_Election_Social_Media_Tweet_Analysis 数据来源:互联网公开数据 标签:Twitter, 社交媒体, 政治, 美国大选, 文本分析, 情感分析, 数据挖掘, 机器学习 数据概述: 该数据集包含来自Twitter平台的推文数据,记录了关于美国总统候选人唐纳德·特朗普(Donald...
-
土耳其地震社交媒体信息数据集_Turkey_Earthquake_Social_Media_Data
土耳其地震社交媒体信息数据集_Turkey_Earthquake_Social_Media_Data 数据来源:互联网公开数据 标签:地震, 社交媒体, 文本分析, 地理位置, 舆情分析, 情感分析, Twitter, 灾害响应 数据概述:...
-
Twitter上的阿拉伯语垃圾账户与恶意内容数据集
Twitter上的阿拉伯语垃圾账户与恶意内容数据集 数据来源:互联网公开数据 标签:阿拉伯语,垃圾信息,恶意内容,Twitter,社交媒体,内容安全,机器学习 数据概述:...
-
沙特阿拉伯社交媒体推文地理位置与用户行为数据集-时间跨度待定-moayadalkhozayem
沙特阿拉伯社交媒体推文地理位置与用户行为数据集-时间跨度待定-moayadalkhozayem 数据来源:互联网公开数据 标签:沙特阿拉伯,推文,社交媒体,Twitter,地理位置,用户行为,文本分析,社会学研究,城市,地点 数据概述:...
-
新冠疫情社交媒体推文分析数据集COVID-19SocialMediaTweets-sameerbairwa07
新冠疫情社交媒体推文分析数据集COVID-19SocialMediaTweets-sameerbairwa07 数据来源:互联网公开数据 标签:新冠疫情, 社交媒体, Twitter, 文本分析, 疫情传播, 舆情监测, 自然语言处理, 情感分析 数据概述: 该数据集包含来自Twitter平台的推文数据,记录了与新冠疫情相关的讨论内容。主要特征如下:...



