-
Pedalion_Based_古希腊悲剧_美狄亚_依存句法树库数据
2026年1月27日 30 115 81
数据集概述 本数据集是基于欧里庇得斯悲剧《美狄亚》构建的古希腊语依存句法树库,由Toon Van Hal主导标注,KU Leuven 2018-2019学年三年级本科生参与标注工作,原始文本预处理由Alek Keersmaekers完成。数据集包含一个XML格式文件,用于记录文本的依存句法结构标注信息。 文件详解...
-
RoMEMES_Source_罗马尼亚社交媒体表情包多模态标注数据
2026年1月27日 30 154 19
数据集概述 本数据集为罗马尼亚语表情包数据集RoMEMES,采集自公共社交媒体平台,包含表情包的文本、图像及相关标注信息。数据经人工标注罗马尼亚语文本、图像复杂度、情感倾向、政治内容属性,文本部分通过RELATE平台自动标注词性、词元及依存句法,同时包含元数据。 文件详解 metadata.tsv 文件格式:TSV...
-
罗马尼亚语言表情包数据集v2
2025年12月5日 30 69 44
数据集概述 该数据集为罗马尼亚语言表情包数据集v2,包含从公共社交媒体平台收集的罗马尼亚语表情包,提供手动标注(文本内容、图像复杂度、极性、情感、政治内容)及自动标注(词性标签、词元、依存句法分析)信息,支持多维度分析。 文件详解 核心文件: metadata.tsv: TSV格式,含文件ID、元数据及手动标注信息 LICENSE: 许可信息文件...
-
通用依存树库动词得分附录数据集
2025年12月4日 30 138 28
数据集概述 该数据集聚焦通用依存树库(UD)覆盖的样本语言,呈现主句与状语从句中动词得分(一至三分)的分布情况,通过PDF文件提供可视化或结构化数据支持。 文件详解 文件名称:advcl6-UD.pdf 文件格式:PDF 内容说明:包含通用依存树库样本语言中,主句与状语从句的动词得分(1-3分)的图表或数据表格,具体字段映射需查看文件内容 适用场景...
-
数据5000语料树结构数据集5000ConstituencyandDependencyTreesDataset-pragyanshusingh01
2025年4月26日 30 83 44
5000语料树结构数据集5000ConstituencyandDependencyTreesDataset-pragyanshusingh01 数据来源:互联网公开数据 标签:语料库,句法分析,依存句法,数据集,自然语言处理,人工智能,语言学,计算机科学...
-
土耳其语通用依存树库数据集TurkishUniversalDependenciesDataset-emirkaanozdemr
2025年4月23日 30 194 35
土耳其语通用依存树库数据集TurkishUniversalDependenciesDataset-emirkaanozdemr 数据来源:互联网公开数据 标签:语言学,依存句法,自然语言处理,土耳其语,数据集,句法分析,语言资源,机器学习 数据概述: 该数据集包含土耳其语的通用依存树库,记录了土耳其语文本的依存句法结构。主要特征如下:...



