数据集 - 海数据

COVID19_Spain_Based_健康科学相关谣言内容分析数据集

2026年1月26日 30 160 89

数据集概述本数据集包含西班牙三家事实核查机构（Maldita.es、Newtral、EFE Verifica） debunked的533条COVID-19相关谣言的内容分析编码数据。涵盖谣言主题、传播平台、格式、地理范围、类型、健康科学细分主题、来源类型等多维度变量，为研究疫情期间谣言传播特征提供结构化数据。文件详解...

ZIP

WF_CE_Based_功函数与解理能计算数据集

2026年2月1日 30 172 60

数据集概述本数据集包含通过高通量密度泛函理论计算得到的功函数与解理能结果，分为未弛豫表面数据库（含58332条记录）和弛豫表面数据库（含90条记录）。数据涵盖材料项目ID、米勒指数、表面元素、功函数、解理能等关键参数，支持材料表面稳定性与电子特性研究。文件详解未弛豫表面数据库文件文件名称：WF-CE_database_58332.json...

ZIP

CANALLS_Based_ALLs利益相关者识别与选择数据2024

2026年1月25日 30 139 35

数据集概述本数据集为ALLs（农业生态景观，Agroecological Landscapes）在重点区域建立过程中的利益相关者识别结果，包含20-30名受访者的访谈数据、问卷及选择标准。通过考虑参与者多样性、能力、农业生态相关活动及参与意愿，筛选出公共/私营部门及农户中的关键行动者，总计包含2个文件。文件详解...

ZIP

Enhancing_gene_transfer_AAV衣壳筛选原始测序数据

2026年1月21日 30 51 7

数据集概述本数据集包含用于提升肾脏肾小管和足细胞基因转移效率的AAV衣壳筛选实验原始数据。主要为支持论文图1和补充图1的AAV Barcode-Seq原始测序读段计数数据，以及AAV衣壳文库中CAGBC101至CAGBC223条形码的转换信息表，帮助关联条形码与对应AAV衣壳类型。文件详解 RawData.zip 文件格式：ZIP...

ZIP

COVID_19_Fake_News_Detection_虚假新闻识别数据集

2026年1月20日 30 8 6

数据集概述本数据集为COVID-19相关的虚假新闻检测数据，由Patwa等人于2021年发布，用于识别和分析新冠疫情期间的虚假信息内容，支持虚假新闻检测模型的训练与验证。文件详解文件名称：Data.xlsx 文件格式：XLSX 字段映射介绍：未提供具体字段信息，推测包含新闻文本内容及对应的真实性标签（真实/虚假）等核心检测字段。数据来源...

ZIP

Janssen_Based_2629种化合物抗SARS_CoV_2_RdRP虚拟筛选及细胞实验验证数据

2026年1月2日 30 105 53

数据集概述本数据集记录了Janssen Pharmaceutica化合物库中2629种化合物针对SARS-CoV-2 RdRP靶点的虚拟筛选结果，以及潜在活性化合物在VeroE6细胞抗SARS-CoV-2实验中的验证数据，核心呈现药物筛选的关键结果。文件详解文件名称：Virtual screening of 2629 Janssen...

ZIP

泰米尔语表情包恶意内容分类数据集

2025年12月20日 30 200 106

数据集概述本数据集是针对泰米尔语表情包的恶意内容分类资源，包含标注为“恶意”和“非恶意”的表情包图像，以及对应的拉丁转写文本，旨在支持印度语言表情包恶意内容的计算建模研究。文件详解文件名称: Tamil_troll_memes-dataset.zip 文件格式: ZIP压缩包内容说明:...

ZIP

数据2020年灾难推文语料库

2025年12月7日 30 41 22

数据集概述该数据集包含2020年收集的、覆盖10类灾难共48起事件的推文数据，每条推文标注了是否与对应灾难相关。数据以平衡正负样本的文件形式组织，旨在为灾难相关推文过滤算法提供基准测试支持。文件详解文件名称：disaster-tweet-filtering-tranquil-tweets.zip 文件格式：ZIP压缩包...

ZIP

RECOD_ai重大事件社交媒体链接数据集

2025年12月13日 30 97 33

数据集概述本数据集包含2018年8月14日至2021年1月6日期间发生的34起法医相关事件的社交媒体内容链接，涵盖火灾、坍塌、枪击等六类事件，提供各事件的社交帖子、图片、视频链接及配套说明文件，支持法医分析研究。文件详解核心压缩文件： recod-ai-events-dataset-...

ZIP

米兰奥古斯特模型数据集

2025年12月11日 30 66 60

数据集概述本数据集包含与“米兰奥古斯特模型”相关的文件，主要由图片文件和三维模型文件构成，为模型的视觉呈现与三维结构展示提供数据支持。文件详解文件名称: thumb0.jpeg、thumb1.jpeg、thumb2.jpeg、thumb3.jpeg：文件格式为JPEG，共4个，占文件总数的百分之八十，推测为模型的缩略图或预览图片。文件名称:...

ZIP

Webis网页错误标注数据集2019

2025年12月8日 30 22 5

数据集概述本数据集包含对Webis-Web-Archive-17中一万个网页存档的多种标注，涵盖广告占比、页面完整性、加载状态、色情内容等类别，以及弹窗、验证码、错误信息的显示程度，为网页内容质量分析提供标注数据支持。文件详解该数据集包含四个文件，具体说明如下： - 数据文件: - webis-web-archive-17-content-...

ZIP

多语言错误信息推文数据集

2025年12月7日 30 121 114

数据集概述该数据集包含多语言错误信息推文（MMTweet）相关的标注指南、结构化数据文件、代码脚本等资源，覆盖推文分类、声明匹配等任务，支持多语言错误信息检测与分析研究。文件详解标注指南文件： Data Annotation – Tweet Classification.pdf：PDF格式，推文分类任务的标注规范文档 Data...

ZIP

CMU_MisCov19新冠疫情Twitter错误信息特征数据集

2025年12月6日 30 187 166

数据集概述该数据集为针对新冠疫情相关Twitter错误信息的标注数据集，包含四千五百七十三条标注推文，覆盖十七个主题，同时提供标注编码手册，用于错误信息检测与特征分析研究。文件详解文件名称：COVID_19_Twitter_Misinformation_Codebook.pdf 文件格式：PDF...

ZIP

HUMANE项目REVEAL子项目人机网络调查协议

2025年12月5日 30 120 70

数据集概述本数据集是HUMANE项目框架下，针对REVEAL子项目设计的调查协议文档。REVEAL项目是人机网络（HMN）的典型案例，提供社交媒体内容聚合、过滤、推荐工具，助力用户分析信息可信度等隐藏维度。该调查聚焦REVEAL项目中人机交互场景，收集相关影响及设计建议反馈。文件详解文件名称：REVEAL Survey1.pdf...

ZIP

CT_FAN多语言假新闻检测数据集2022

2025年12月5日 30 208 117

数据集概述该数据集为多语言假新闻检测任务设计，包含2010-2022年英文和德文新闻文章，标注其真实性评级（假、部分假、真、其他）及主题领域，支持跨语言迁移学习研究，适用于构建多语言假新闻分类模型。文件详解文件名称：FakeNews_Task3_2022.zip 文件格式：ZIP压缩包内部数据字段： ID：新闻文章唯一标识符...

ZIP

虚假新闻检测数据集GottobeFakeData-nikhilkottoli

2025年5月28日 30 99 24

虚假新闻检测数据集GottobeFakeData-nikhilkottoli 数据来源：互联网公开数据标签：虚假新闻，数据集，自然语言处理，文本分析，机器学习，信息检索，新闻媒体，谣言识别数据概述：该数据集包含用于虚假新闻检测的数据，记录了新闻文章的真实性标签和相关文本内容。主要特征如下：...

ZIP

电子邮件检测数据集EmailsDetectionDataset-gungunshukla15

2025年4月25日 30 134 13

电子邮件检测数据集EmailsDetectionDataset-gungunshukla15 数据来源：互联网公开数据标签：电子邮件，垃圾邮件检测，数据集，机器学习，文本分析，网络安全，文本挖掘，信息过滤数据概述：...

ZIP

垃圾邮件检测数据集SpamEmailDetectionDataset-studymart

2025年4月25日 30 97 19

垃圾邮件检测数据集SpamEmailDetectionDataset-studymart 数据来源：互联网公开数据标签：垃圾邮件，电子邮件，数据集，机器学习，分类算法，网络安全，数据处理，信息过滤数据概述：该数据集包含来自多个来源的电子邮件记录，主要用于垃圾邮件检测和分类。主要特征如下：时间跨度：数据记录的时间范围从2002年到2015年。...

ZIP

垃圾邮件和短信数据集SpamMailsandMessagesDataset-milindashehandilhara

2025年4月24日 30 72 51

垃圾邮件和短信数据集SpamMailsandMessagesDataset-milindashehandilhara 数据来源：互联网公开数据标签：垃圾邮件，短信，数据集，文本分析，机器学习，自然语言处理，信息过滤，网络安全数据概述：该数据集包含来自多个来源的垃圾邮件和短信数据，记录了不同类型的垃圾信息。主要特征如下：...

ZIP

垃圾邮件检测数据集SpamEmailsDetectionDataset-talhabarkaatahmad

2025年4月24日 30 48 10

垃圾邮件检测数据集SpamEmailsDetectionDataset-talhabarkaatahmad 数据来源：互联网公开数据标签：垃圾邮件检测，数据集，电子邮件分析，机器学习，信息过滤，网络安全，数据科学，文本分析数据概述：该数据集包含来自多个来源的电子邮件数据，用于垃圾邮件检测任务。主要特征如下：...

ZIP

找到26个数据集

注册成功！