-
罗马戴克里先浴场危险事件检测推文数据集
2026年2月10日 30 150 92
数据集概述 本数据集包含2018年5月至2019年5月期间从Twitter流中提取的276865条推文,用于检测罗马戴克里先浴场遗址的危险事件。每条推文包含ID、文本内容、GPS信息、定位、时间及事件检测标签(标记是否包含该遗址危险事件的有用信息)。数据集仅包含一个文件。 文件详解 文件名称:TweetsDataset.xlsx 文件格式:XLSX...
-
CommTweet_社交媒体有机商业推文数据
2026年2月9日 30 174 23
数据集概述 本数据集包含来自多个官方账号的有机商业推文数据,核心为社交媒体平台上的商业相关推文内容,数据集仅包含一个JSON格式文件,无目录分层及数据划分。 文件详解 文件名称:commTweets.json 文件格式:JSON 字段映射介绍:未提供具体字段信息,推测包含推文文本、发布账号、发布时间等社交媒体推文基础字段 适用场景...
-
MIGNEX_Based移民相关政策数据库数据集
2026年2月1日 30 2 1
数据集概述 本数据集为MIGNEX政策数据库,核心内容是与移民相关的政策数据,旨在为移民政策研究提供结构化参考资料。数据集仅包含一个文件,无分层目录结构,未进行训练测试、数据标签或原始/处理数据的拆分。 文件详解 文件名称:mignex-policy-dataset-v1.xlsx 文件格式:XLSX...
-
Weibo_Scrapy_核污染水相关微博帖子数据
2026年1月31日 30 183 17
数据集概述 本数据集为Scrapy网络爬虫获取的核污染水相关微博帖子数据,用于研究中日两国对福岛核污染水排放事件的框架分析。数据包含1个文件,无目录结构,无训练/测试、数据/标签、原始/处理数据的划分。 文件详解 文件名称:Treated Radioactive Water.xlsx 文件格式:XLSX...
-
学术会议中的信息搜寻行为_Twitter信息行为研究数据集
2026年1月29日 30 173 129
数据集概述 本数据集包含学术会议场景下的Twitter社交媒体数据,分为两部分:一是2008至2013年66个学术社区发布的33万余条会议相关推文;二是含人工标注的信息寻求类推文(1,899条标注数据、9,967条未标注数据),用于研究学术会议中的信息寻求行为、社交网络特征及响应规律。 文件详解...
-
SUIN_Based哥伦比亚司法法令详细数据1999_2022
2026年1月28日 30 100 54
数据集概述 本数据集为哥伦比亚司法系统SUIN平台1999至2022年的法律体系法令详细数据,涵盖司法领域的法令信息。数据集以单一文件形式呈现,可用于研究哥伦比亚司法体系的法令内容及演变情况。 文件详解 文件名称:Colombia. Justicia. SUIN. 1999 2022. Ordenamiento Jurídico. Decretos...
-
Twitter_Fakenews_2016美国大选病毒式推文数据
2026年1月28日 30 58 56
数据集概述 本数据集包含2016年美国大选期间(2016年11月8日至2017年3月)达到1000次转发阈值的病毒式推文,通过Twitter流API以特定标签和用户句柄获取,内容涉及虚假新闻相关分类标注,共1个文件。 文件详解 文件名称:twitter_fakenews_USElections_2016.xlsx 文件格式:XLSX...
-
Twitter_FakeNews_Based虚假新闻传播实证研究数据集
2026年1月23日 30 169 69
数据集概述 本数据集包含Twitter平台上5个新建虚假新闻传播过程的实证研究结果,涵盖虚假新闻及其对应的真相传播内容。数据集分为传播数据集(DD)和图数据集(DG)两类,记录了虚假新闻相关推文、转发的用户信息、传播路径及用户网络关系,共15个文件。 文件详解 传播数据集(DD) 文件名称:遵循FNx_DD.xlsx模式(x为虚假新闻编号1-5)...
-
哥伦比亚_El_Tiempo_日报单日新闻提取数据_20221111
2026年1月25日 30 29 10
数据集概述 本数据集为哥伦比亚《El Tiempo》日报2022年11月11日的新闻提取数据,包含当天该报纸发布的新闻内容,以结构化格式存储,可用于新闻内容分析、媒体研究等场景,数据集仅含一个文件。 文件详解 文件名称:news_eltiempo_11-11-2022.json 文件格式:JSON...
-
IC_ac_uk_Based_rzepa博客文章完整导出数据2020
2026年1月25日 30 159 38
数据集概述 本数据集为WordPress博客文章的XML归档文件,包含2008年至2020年3月7日期间发布于https://www.ch.ic.ac.uk/rzepa/blog的所有博客文章内容,可用于学术博客内容分析、文本挖掘等研究场景,仅包含一个文件。 文件详解...
-
AprendeINTEF_Based_2017_2020年平台课程数据
2026年1月23日 30 94 33
数据集概述 本数据集为AprendeINTEF平台2017至2020年提供的课程数据矩阵,包含该平台在此期间所有课程的相关信息,是了解平台课程体系和内容分布的基础数据。 文件详解 文件名称:Dataset_MCCDD.xlsx 文件格式:XLSX...
-
MataNajwa_Postingan_2024年8月帖子互动率数据集
2026年1月22日 30 37 0
数据集概述 本数据集包含MataNajwa账号2024年8月发布帖子的互动率相关数据,共1个文件,无子目录结构,未区分训练/测试、数据/标签、原始/处理数据类型,核心文件为Excel格式。 文件详解 文件名称:Dataset Engagement Rate Postingan MataNajwa Agustus 2024.xlsx 文件格式:XLSX...
-
Azores_IPMA_Based亚速尔群岛中部气象预警历史记录数据集
2026年1月22日 30 105 38
数据集概述 本数据集为亚速尔群岛中部区域的气象预警历史记录,由葡萄牙海洋与大气研究所(IPMA)发布。记录包含2019至2025年的预警信息,涵盖预警年份、月份、编号、发布时间、气象参数、预警级别、有效起止时间及持续时长等核心内容,共1个文件。 文件详解 文件名称:Azores_Meteo_Warnings_Central group_...
-
CyberSecNews_Based_德英网络安全新闻人工分类标注数据集
2026年1月21日 30 102 93
数据集概述 本数据集包含457篇德语和英语新闻文章,通过RSS源从各类新闻网站和博客收集。每篇文章经AIT数字安全与安全中心同事人工分类,标注为“网络安全”“非网络安全”或“不确定”,并提供文章标题、内容、语言、来源、发布时间、版权声明及参与者分类结果等信息,无缺失值。 文件详解 文件名称:cybersec_news_de_en.json...
-
Twitter_Based_事件及名人相关级联推文元数据_2010_2018
2026年1月20日 30 63 38
数据集概述 本数据集包含Twitter平台上特定事件及名人相关的级联推文元数据,覆盖2015年尼泊尔地震、2018年印度板球超级联赛(IPL)、西班牙15-M运动,以及2010年Lady Gaga及其粉丝的推文内容,记录了推文传播链、用户交互等信息,支持社交媒体级联传播研究。 文件详解 2015尼泊尔地震数据集...
-
BioStars_API_Based_生物信息学论坛问答数据20220327
2026年1月20日 30 60 14
数据集概述 本数据集为BioStars问答论坛API输出内容,涵盖截至帖子ID(UID)9557161的论坛数据,包含生物信息学、计算基因组学及生物数据分析相关的问答内容。数据集由Zenodo平台发布,遵循BioStars内容许可协议,不含9463943至494831号ID的内容,总计包含一个JSON文件。 文件详解...
-
PACO_Based_哥伦比亚透明度秘书处反腐败新闻整合数据2020_2023
2026年1月20日 30 103 75
数据集概述 本数据集为2020-2023年哥伦比亚反腐败门户网站(PACO)收录的腐败相关新闻整合数据,由哥伦比亚透明度秘书处提供。数据涵盖该时间段内平台登记的腐败新闻信息,是研究哥伦比亚反腐败监督及腐败事件动态的结构化资料。 文件详解 文件名称:NOTICIAS_PACO-CONSOLIDADO V2.xlsx 文件格式:XLSX...
-
Pyrrhic_Press_Articles_文章元数据结构化集合_20241010
2026年1月18日 30 66 53
数据集概述 本数据集为Pyrrhic Press平台发布的文章元数据XML文件,包含文章标题、发布链接、日期时间、内容摘要等结构化信息,覆盖商业理论、教育、人工智能、组织韧性等主题,支持内容检索与管理。 文件详解 文件名称:Articles _ PyrrhicPress.Org.xml 文件格式:XML 字段映射介绍:包含以下核心元素...
-
PALOMERA_Social_Media_Posts_Dataset_202412
2026年1月18日 30 55 41
数据集概述 本数据集为PALOMERA项目的社交媒体帖子数据,包含项目相关的社交媒体帖子信息,记录了帖子发布时的URL以评估实时影响(浏览量和转发量)。若相关组织账号停用或帖子删除,URL可能失效。数据集仅含一个文件。 文件详解 文件名称:PALOMERA Social Media Posts Data Set 12 December...
-
PairFac_Event_Analytics_2015年巴黎恐怖袭击相关地理标记推特数据
2026年1月13日 30 160 103
数据集概述 本数据集包含2015年10月16日至11月20日期间通过Twitter API收集的巴黎地区地理标记推特数据,共75,982条。数据用于灾害事件影响的定量评估研究,支持通过多维度城市行为分析识别事件后的显著变化,是PairFac方法验证的核心数据之一。 文件详解 文件名称:Geo_Tweets_Paris-1.1.1.zip...



