-
VeLeSpa_Spanish_西班牙语动词词库数据
2026年1月31日 30 83 33
数据集概述 本数据集为VeLeSpa,是半岛西班牙语的动词词库,包含六百五十五三个动词的全部六十三个音系形式词形变化范式,以及对应的词目级和词形级频率数据。数据集共包含十个文件,涵盖数据表格、说明文档、代码文件等类型。 文件详解 数据文件(CSV格式) 文件名称:VeLeSpa_cells.csv、VeLeSpa_features-...
-
Eesthetic_爱沙尼亚语词形范式数据v1_0_5
2026年1月31日 30 192 72
数据集概述 本数据集为Eesthetic,是爱沙尼亚语动词和名词的词形范式集合,包含音位和正字法两种记法,适用于计算与人工分析,符合Paralex标准。数据集仅含一个压缩文件。 文件详解 文件名称:eesthetic-v1.0.5.zip 文件格式:ZIP...
-
Parahungarian_Based_匈牙利名词范式词典数据集
2026年1月28日 30 178 61
数据集概述 本数据集为匈牙利名词数据集,基于Unimorph数据清理而来,采用Paralex标准格式构建,包含10个文件,涵盖结构化CSV表格、说明文档、元数据等。数据以关系模型组织,提供匈牙利名词的词形、词素、特征值等信息,适用于语言学研究与自然语言处理任务。 文件详解 数据文件(CSV格式,共5个)...
-
Paralatvian_Paralex_Based_拉脱维亚语名词屈折数据集
2026年1月20日 30 166 152
数据集概述 本数据集是遵循Paralex标准格式的拉脱维亚语名词屈折数据集,由Unimorph数据清理而来,包含9个文件,无目录层级。数据采用关系模型结构化存储,以CSV表格为主,辅以元数据和说明文档,覆盖名词的词形、屈折特征、音素等信息,适用于拉脱维亚语语法研究与自然语言处理任务。 文件详解 数据文件(.csv):共5个...
-
数据2021年APSEC会议_核心命名标识符数据集的实证研究_协同重命名标识符研究数据
2026年1月14日 30 136 20
数据集概述 本数据集为《协同重命名标识符实证研究》的附录数据,包含四个CSV文件,分为重命名数据和关系数据两类,每类又按是否忽略词形变化分为两个文件。数据记录了代码库中标识符的重命名操作及重命名间的关系,支持软件开发中标识符重命名规律的分析。 文件详解 重命名数据文件 Rename.csv 文件格式:CSV...
-
Zalilex_俄语名词词形变化词典
2025年12月24日 30 93 78
数据集概述 该数据集是基于Zaliznyak词典数字化版本提取的俄语名词词形变化词典,包含俄语名词的屈折变化信息,以压缩包形式存储,为俄语词汇形态学研究提供数据支持。 文件详解 文件名称:zalilex-v1.0.0.zip 文件格式:ZIP压缩包(.zip)...
-
古埃及词典数据集V1_0
2025年12月12日 30 1 0
数据集概述 本数据集为古埃及词典(AED)V1.0版本,包含超过三万个词汇条目及五万多条词形出现记录,为研究古埃及语言词汇提供基础数据支持。 文件详解 文件名称: simondschweitzer/aed-v1.0.zip 文件格式: ZIP压缩包 内容说明: 压缩包内包含古埃及词典的核心数据,具体字段及结构需解压后查看原始文件 数据来源...
-
宾夕法尼亚德语词表_词形还原与词性标注
2025年12月4日 30 73 5
数据集概述 该数据集包含ENDE语料库中宾夕法尼亚德语部分的词表,涵盖1761个词元及其对应的2704个词形,已完成词形还原和词性标注,为宾夕法尼亚德语的语言分析提供基础数据。 文件详解 词表数据文件: 文件名称:ENDE-corpus POS-annotated PDC lexicon.tsv 文件格式:TSV(.tsv)...
-
全球352种语言形态标注数据集
2025年4月16日 30 59 0
全球352种语言形态标注数据集 数据来源:互联网公开数据 标签:语言学,形态学,词形变化,多语种,自然语言处理,Unimorph,特征标注 数据概述:...
-
德语情感词典数据集2021
2025年4月15日 30 159 138
德语情感词典数据集2021 数据来源:互联网公开数据 标签:情感分析,意见挖掘,德语,情感词典,极性评分,词性标注,词形变化 数据概述: 本数据集收录了用于情感分析和意见挖掘的德语情感词典,即SentiWS。数据集包含标记了情感极性的词及其词性标注,极性值范围为[-1,...



