-
Pedalion_Based_古希腊悲剧_美狄亚_依存句法树库数据
数据集概述 本数据集是基于欧里庇得斯悲剧《美狄亚》构建的古希腊语依存句法树库,由Toon Van Hal主导标注,KU Leuven 2018-2019学年三年级本科生参与标注工作,原始文本预处理由Alek Keersmaekers完成。数据集包含一个XML格式文件,用于记录文本的依存句法结构标注信息。 文件详解...
-
Wiki_misc_Based_Wikidata_RDF转储文件集
数据集概述 本数据集为通过wdumps工具生成的Wikidata RDF转储文件集(wiki_misc),包含4个文件,涵盖配置文件、规范文件、压缩数据文件及预览文件。数据记录了转储的元信息、生成参数及示例数据,可用于了解Wikidata转储的结构与格式。 文件详解 配置与元信息文件 文件名称:info.json 文件格式:JSON...
-
Wikidata_Based_足球运动员职业数据_RDF_dump
数据集概述 本数据集是通过wdumps工具生成的Wikidata RDF转储,包含Wikidata中所有职业为足球运动员(occupation: association football player, Q937857)的实体数据。数据集提供结构化的RDF格式数据,支持对足球运动员相关信息的批量检索与分析。 文件详解 配置与元数据文件...
-
Wikidata_Based_韩国企业RDF_Dump数据_基础版
数据集概述 本数据集是通过wdumps工具生成的Wikidata韩国企业RDF Dump数据,包含实体、陈述和三元组等语义网络相关信息,文件总数为4个,涵盖JSON、NT、GZ等格式,可用于韩国企业相关的语义数据研究与分析。 文件详解 info.json 文件格式:JSON...
-
TWKM_Based_古典玛雅文献数据库与词典_2014_2025
数据集概述 本数据集是“古典玛雅文献数据库与词典(TWKM)”项目的Zotero导出文献数据库,截至2025年3月。包含1746至2025年的4万余条书目条目,覆盖玛雅文化的碑铭学、考古学、语言学等多领域,是数字碑铭学和拉丁美洲文化遗产研究的核心参考资源,文件为JSON格式。 文件详解...
-
novel_request_Based_十部小说中文请求句语料数据
数据集概述 本数据集包含从十部小说中提取的中文请求句语料,核心内容为小说中的请求类句子集合,可用于中文自然语言处理领域的相关研究,数据集仅包含一个文件。 文件详解 文件名称:corpus novel_request.xlsx 文件格式:XLSX 字段映射介绍:未提供具体字段信息,文件内容为从十部小说中提取的中文请求句语料集合 适用场景...
-
SURel_Based_德语词汇同步语义相关性判断数据集_2021
数据集概述 本数据集包含德语词汇使用对的同步语义相关性判断,涵盖通用语言和烹饪领域场景。数据旨在为术语提取中融入词义变化提供基准,支持语义分析相关研究。版本为3.0.0,发布于2021年12月15日。 文件详解 文件名称:surel.zip 文件格式:ZIP...
-
Wikidata_Based_P31_Q154属性测试RDF数据集
数据集概述 本数据集是通过wdumps工具生成的Wikidata RDF转储数据,针对P31-Q154属性进行测试。包含98个实体、779条陈述和7840个三元组,共4个文件,无目录层级结构,未进行训练/测试、数据/标签或原始/处理数据的拆分。 文件详解 文件名称:info.json 文件格式:JSON...
-
OntoVE_Archeo_Based_考古文物位置语义查询结果数据
数据集概述 本数据集为基于OntoVE_Archeo本体的Sparql查询结果,包含四项考古文物的语义化关联信息,记录了文物的本体URI、当前存放位置的本体URI及对应的意大利语标签,是考古文物位置信息的结构化语义数据。 文件详解 文件名称:queryResults (1).json 文件格式:JSON 字段映射介绍:...
-
IN01061_Sanskrit_XML_Talagunda碑铭数据
数据集概述 本数据集包含IN01061编号的Talagunda碑铭数据,该碑铭属于Queen Prabhavati时期、Mrgesavarman统治时代,以梵语XML格式呈现,不含元数据。数据集仅包含一个文件,用于历史铭文文本的数字化存储与分析。 文件详解 文件名称:IN01061.xml 文件格式:XML...
-
BCC_Corpus_Based_中文时间词空间化分类与频率标注数据
数据集概述 本数据集为论文“The role of spatial terms in time expressions: A case study of Chinese temporal...
-
Wikidata_RPG_Games_RDF_Dump_语义网络数据
数据集概述 本数据集是通过wdumper工具生成的Wikidata中RPG游戏相关的RDF转储数据,包含数据元信息、转储配置、RDF三元组压缩文件及预览文件,共4个文件,可用于获取RPG游戏的结构化语义数据。 文件详解...
-
BioPortal_实验_3_归纳测试_硬度调查_OWL本体分类数据
数据集概述 本数据集为博士论文《Module-based classification of OWL ontologies》第六章实验3的结果,包含BioPortal上分类测试难度调查的最终数据表及分析脚本,未涵盖原始数据和中间状态。数据用于研究OWL本体的模块化分类方法,共1个压缩文件。 文件详解...
-
Wikidata_Based_Wikidata机器学习RDF转储数据
数据集概述 本数据集是通过wdumps工具生成的Wikidata的RDF转储数据,包含实体、声明、三元组等结构化信息,适用于机器学习相关场景的数据处理与分析。 文件详解 文件名称:info.json 文件格式:JSON...
-
CMIP6_IPCC_AR6_WGI图8_26输入数据使用与引用信息
数据集概述 本数据集记录IPCC第六次评估报告第一工作组(AR6 WGI)图8.26生成所用的CMIP6输入数据使用及引用信息,包含数据集使用列表、引用信息及数据溯源标识符(Handle ID、DOI)。数据集提供人类可读CSV与机器可处理JSON-LD两种文件,支持气候评估报告数据的溯源与引用管理。 文件详解 文件名称:fig_8_26.csv...
-
Tesla_Battery_SOH_公众调查数据_2025_06_18
数据集概述 本数据集为2025年6月18日下载的Tesla电池健康状态(SOH)公众调查反馈数据,基于第三方未经验证的信息,包含电池衰减相关的调查结果,需注意数据无科学意义,未来衰减趋势估算存在不精确性。 文件详解 文件名称:Copy of Tesla - Battery State of Health.xlsx 文件格式:XLSX...
-
Wikidata_Based_PersonsView实体RDF转储数据
数据集概述 本数据集是通过wdumper工具生成的Wikidata人物视图(PersonsView)的RDF格式转储数据,包含人物实体相关的结构化语义数据。数据集包含4个文件,涵盖配置信息、转储数据和预览文件,可用于Wikidata人物实体的语义分析与知识图谱构建。 文件详解 文件名称:info.json 文件格式:JSON...
-
Astronomia_nova_Kepler著作预处理文本机器学习数据集
数据集概述 本数据集为开普勒《新天文学》(Astronomia nova)的预处理文本语料库,源自Donahue翻译的2015年修订版,经OCR和自动化文本处理生成UTF8编码的机器可读纯文本,移除特殊字符、引用标记等,保留部分OCR误差。包含3个文件,用于机器学习场景。 文件详解 readme.md 文件格式:MD...
-
Neo_Assyrian_Oracc_Based新亚述语料库族名分布模式研究数据
数据集概述 本数据集是论文“Broad-scale patterns in the distribution of ethnic names in the Neo-Assyrian Oracc corpus”的关联表格与列表,包含8个文件,涉及族名分布的语义分析、拼写标准化、文本类型分类等内容,用于支撑新亚述Oracc语料库中族名分布模式的研究。...
-
PLATO_ESR3_01_Based_欧盟国家援助政治化研究数据集
数据集概述 本数据集包含2000至2008年间欧盟266个被标记为“非法且需追回援助”(UWRA)的国家援助案例信息,是研究欧盟政策政治化与去政治化过程的核心数据支撑。数据集聚焦苹果(爱尔兰)和伊尔瓦(意大利)两个重点案例,可用于分析成员国、企业与欧盟委员会在国家援助争议中的互动逻辑。 文件详解 文件名称:State Aid Cases...



