-
SAUCE_Based大学校园环境语义标注图像数据集
2026年1月31日 30 169 18
数据集概述 本数据集包含三十张人工标注的分辨率为640x480的图像,由安装在iCab研究平台前部的Bumblebee2立体相机采集。图像标注涵盖校园导航所需的四类核心对象:可通行区域、花园、障碍物和行人,为校园环境语义理解提供基础数据。 文件详解 文件名称:SAUCE.zip 文件格式:ZIP...
-
KOnPoTe_Resources_船只与餐厅语义资源数据
2026年1月30日 30 164 40
数据集概述 本数据集包含KOnPoTe项目下与船只和餐厅相关的语义资源数据,涵盖本体结果、黄金标准、本体输入文件及语料库文件,共8个文件,主要用于自然语言处理领域的语义分析与本体构建相关研究。 文件详解 OWL文件(6个)...
-
CafeteriaFCD_Based_食品消费数据语义标注资源
2026年1月28日 30 152 52
数据集概述 本数据集为CafeteriaFCD语料库的FoodBase精选版本,包含一千份经手动评估的食谱,标注了来自Hansard分类法、FoodON和SNOMED-CT三种食品语义资源的标签。数据共包含三个文件,均为XML格式,可用于食品语义标注相关的研究与分析。 文件详解 CafeteriaFCD_foodon.xml 文件格式:XML...
-
Biolinks_Source_科学出版物语义分布与相似性支持数据集
2026年1月23日 30 63 9
数据集概述 本数据集为Biolinks项目配套资源,包含科学出版物的语义标注、相似性矩阵、信息增益计算结果及相关算法与可视化组件。基于TREC-05集合的4240篇文献,提供标题摘要(TA)、标题摘要+全文(TAFT)、全文(FT)三种语义标注数据集,支持语义组分布评分与相似性计算,可用于生命科学领域文献检索的语义分析优化。 文件详解 标注与数据集文件...
-
AuCoPro_Semantics_Based_复合词语义自动分析数据集
2026年1月22日 30 158 9
数据集概述 本数据集用于复合词的自动语义分析,包含荷兰语和南非荷兰语的语义标注名词-名词复合词(NN),每种语言分两轮标注,标注指南基于Ó Séaghdha(2008)的标准;还包含荷兰语其他名词性复合词(XN),采用新开发的标注方案。数据集以压缩包形式提供,共1个文件。 文件详解 文件名称:AUCOPRO.Semantics.zip 文件格式:ZIP...
-
SDGs_Based_联合国可持续发展目标语义范围受控词汇表_V1_2_1_3
2026年1月20日 30 162 117
数据集概述 本数据集是定义联合国可持续发展目标(SDGs)语义范围的受控词汇表,包含经过多步骤构建的标准化术语集合,可用于对文本记录进行SDGs相关的标签标注与索引,支持SDGs主题内容的语义关联与检索。 文件详解 文件名称:sdg_vocabulary_V1.2 [zenodo].xlsx 文件格式:XLSX...
-
人_机器_文化_基于中世纪手稿的月工场景图像ICONCLASS标注数据集2023
2026年1月19日 30 2 1
数据集概述 本数据集包含柏林国家图书馆2023年6月至7月联合柏林自由大学举办的Datathon成果,对4部15-16世纪数字化手稿中的48幅月工场景图像进行标注,内容涵盖图像区域、主题的图像学解释及对应的ICONCLASS符号,支持TEI.XML和JSON两种格式。 文件详解 JSON格式标注文件(共4个)...
-
openwashdata_Based_WASH开放研究数据信息数据集_v0_0_1
2026年1月15日 30 157 128
数据集概述 本数据集聚焦水、环境卫生与个人卫生(WASH)领域的开放研究数据,包含washdev和uncnewsletter两个子数据集,收集科学文献的元数据、补充材料信息、数据可用性声明及语义信息等内容,为WASH领域开放数据研究提供结构化资源。 文件详解 文件名称:openwashdata/washopenresearch-v0.0.1.zip...
-
TEI_XML_Based_萨克森选帝侯约翰_格奥尔格二世1665年宫廷日记完整转录数据_Release2
2025年12月30日 30 64 31
数据集概述 本数据集包含1665年萨克森选帝侯约翰·格奥尔格二世宫廷日记(SLUB Mscr.Dresd.K.80)的完整手写转录版本,遵循DTABF标准提供TEI:XML格式文件及PDF阅读版。XML文件通过元素拆分日记条目,标注日期、人物、地点及格式元素,PDF由TEIGarage简单转换生成,未优化排版。 文件详解 文件名称:SLUB Dresd...
-
UIMA_ConceptMapper_Based_2021_BioASQ语料库药物与癫痫本体术语标注字典数据
2025年12月28日 30 3 0
数据集概述 本数据集包含用于UIMA ConceptMapper工具的字典文件,用于对2021 BioASQ语料库进行药物名称及癫痫本体术语标注。字典分别源自DrugBank词汇库及NCBO BioPortal的EpSO、ESSO、EPILONT、EPISEM、FENICS五种癫痫本体,共六个XML格式文件,可支撑生物医学文本的语义实体识别与标注。...
-
俄语词义消歧语料库_RuSemCor
2025年12月23日 30 149 138
数据集概述 该数据集是一个为俄语设计的词义消歧语料库,通过WordNet进行语义标注,属于链接开放数据云(LLOD cloud)资源。包含标注数据文件和语料库归档文件,支持自然语言处理领域的词义消歧研究。 文件详解 文件名称: sense_annotations.tsv 文件格式: TSV (.tsv) 字段映射:...
-
ARASAAC黑白象形图数据集第五部分
2025年12月23日 30 103 74
数据集概述 该数据集为ARASAAC项目的黑白象形图资源,包含一千张PNG格式的黑白图像,主题涵盖信息、医学、自然、技术等多个领域,由Sergio Palao创作,是ARASAAC十四部分象形图资源中的第五部分。 文件详解...
-
动词的语义与语用解释数据集
2025年12月22日 30 190 115
数据集概述 该数据集包含一份关于动词语义与语用解释的文档,聚焦于动词在语言使用中的意义理解与实际应用分析,为语言学领域相关研究提供资料支持。 文件详解 文件名称: N.Djumaeva .pdf 文件格式: PDF (.pdf) 文件内容: 文档类文件,围绕动词的语义与语用解释展开论述,具体内容需通过阅读PDF获取。 适用场景 语言学研究:...
-
BiodivTab语义表格标注任务基准数据集
2025年12月22日 30 89 13
数据集概述 本数据集是针对语义表格标注任务的基准数据集BiodivTab,以表格形式组织生物多样性相关数据,为评估语义表格标注算法性能提供标准测试资源。 文件详解 文件名称: BiodivTab_DBpedia.zip:压缩文件格式,内容未提供预览,推测包含与DBpedia关联的生物多样性表格数据。 文件名称:...
-
乌尔都语中源自英语的医学术语结构语义分析
2025年12月21日 30 121 37
数据集概述 该数据集包含一份关于乌尔都语中源自英语的医学术语的结构语义分析文档,以PDF格式呈现,为研究医学术语跨语言演变及语义特征提供资料支持。 文件详解 文件名称: Vahobova Shoira.pdf 文件格式: PDF (.pdf) 文件内容: 围绕乌尔都语中源自英语的医学术语展开结构与语义层面的分析,具体内容需查阅文档原文。 适用场景...
-
GOOSE三维语义分割挑战赛标签数据集
2025年12月20日 30 131 42
数据集概述 该数据集包含GOOSE和GOOSE-Ex数据集的LiDAR点云语义分割标注。原始64类标注被整合为8个超类加“其他”类,共含一万三千零六份标注点云,以.label格式存储,遵循SemanticKITTI数据集格式规范。 文件详解 文件名称: README.txt,文件格式: TXT (.txt),内容:...
-
GitTables基准测试_列类型检测数据集
2025年12月20日 30 28 21
数据集概述 本数据集是GitTables语料库的一个子集,专为列类型检测方法的基准测试设计。它基于DBpedia和Schema.org本体的语义类型,用于评估系统对表格列进行语义标注的能力,曾用于SemTab 2021挑战赛的CTA任务。数据集包含表格样本、目标列信息、标注真值及标签映射文件,支持列类型检测模型的训练与评估。 文件详解...
-
含道德伦理评价意义的俄语成语数据集
2025年12月7日 30 57 49
数据集概述 该数据集核心内容为包含道德伦理评价意义的俄语成语,以单个PDF文档形式呈现,为研究俄语成语的语义特征及道德伦理内涵提供数据支持。 文件详解 文件名称: Расулов Илхом Инамович.pdf 文件格式: PDF (.pdf) 文件内容: 包含具有道德伦理评价意义的俄语成语相关内容,具体字段及结构需通过PDF文档内容解析获取...
-
Mataws标注Web服务集合数据集
2025年12月16日 30 114 77
数据集概述 该数据集包含八百一十六个Web服务描述,基于Assam项目FullDataset扩展而来,通过Mataws工具添加语义标注。每个服务含语法版与语义版两种格式(WSDL和OWL-S),并按主题分类,为Web服务语义标注研究提供数据支持。 文件详解 文件名称: Annotated.FD-v1.0.zip 文件格式: ZIP压缩包 内容说明:...
-
古典雅典法律主体本体数据集v_1_0
2025年12月14日 30 51 9
数据集概述 该数据集为古典雅典法律主体本体的1.0版本,聚焦公元前约四百一十九年至三百二十三年雅典法庭的主要法律主体定义,法律主体指主持或裁决法律程序的个人或群体,基于阿提卡演说词、伪亚里士多德《雅典政制》及相关著作构建。 文件详解 文件名称: Legal_bodies_Ontology_v.1.0.rdf,文件格式:...



