-
食品领域语义表注释基准测试集
2026年2月12日 30 109 11
数据集概述 本数据集是面向食品领域的表格数据到知识图谱匹配基准数据集tFood,包含水平关系表和实体表两种类型表格,支持基于Wikidata的主题检测、单元格实体标注、列类型标注、列属性标注四类语义表标注任务,用于SemTab 2023第一轮竞赛,测试集真值暂未公开。 文件详解 文件名称:tfood_wiith_test_gt.zip 文件格式:ZIP...
-
COVID_Twitter_Based_巴西和美国COVID_19相关推文主题检测与情感分析数据集
2026年1月7日 30 46 19
数据集概述 本数据集包含2020年4月17日至8月8日期间,巴西和美国与COVID-19相关的推特消息ID,分为葡萄牙语和英语两个文件,各约300万条ID。用户可通过ID下载完整推文对象,用于主题检测和情感分析研究。 文件详解 文件名称:covid-data-pt-unique-ids.zip 文件格式:ZIP...
-
疾病生态学跨学科领域人口统计学教育及研究趋势数据集
2025年12月23日 30 34 0
数据集概述 本数据集围绕疾病生态学跨学科领域,包含该领域的人口统计学、教育及研究趋势相关数据,涵盖文献纳入情况、伦理审查文件、完整调查问卷及分析代码等多类型文件,为研究该领域发展提供支持。 文件详解 文件名称:TopArticles_Inclusion.xlsx,文件格式:Excel(.xlsx)...
-
Reddit政治用户多主题互动数据集2007_2022
2025年12月18日 30 30 12
数据集概述 本数据集包含2007-2022年Reddit政治子版块的用户互动数据,涵盖每周用户网络及消息数据库。网络中节点为用户,边为互动关系;消息库含主题、毒性、立场等属性,为研究政治话题互动提供支持。 文件详解 文件名称: message_data.zip 文件格式: ZIP压缩包 内容说明:...



