找到45个数据集

标签: 词汇特征

过滤结果
  • UBA000159630_Entangled_Histories_荷兰共和国多省法令汇编转录数据_1705

    2025年12月31日 30 51 21

    数据集概述 本数据集为1705年出版的荷兰共和国法令汇编《Groot placaet-boeck》的转录数据,收录荷兰省、西弗里西亚省和泽兰省的法令、条例及敕令。基于阿姆斯特丹大学图书馆藏本转录,由KB荷兰皇家图书馆数字化,用于历史法律文献研究。 文件详解 文件名称:UBA000159630.zip 文件格式:ZIP...
    packageimg
  • Lower_Fungom_Mundabli_Based_非洲语言词汇数字化完整数据

    2025年12月24日 30 78 18

    数据集概述 该数据集为Mundabli语言的225词表,Mundabli属Yemne-Kimbi语组,通行于喀麦隆西北部Menchum区Fungom分区Lower Fungom地区,语言有声调且名词前缀演变为修饰语一致标记,词表包含两位顾问提供的词汇及个体变异。 文件详解...
    packageimg
  • Archi_Text_Corpus_Based_阿奇语2006_2007年语料库完整数据

    2025年12月23日 30 187 111

    数据集概述 本数据集为阿奇语语料库,包含2006-2007年在阿奇村收集的50余篇多体裁文本,涵盖故事、对话、传说、歌曲等,多数配有音视频记录。内容包含重新录制的1977年已发表文本及新采集文本,本版本文本均源自1977年出版的《阿奇语:文本与词典》。 文件详解 文档文件(共66个,包含两种格式):...
    packageimg
  • 菲特拉特作品中表达社会政治关系的复合词汇数据集

    2025年12月22日 30 88 59

    数据集概述 本数据集围绕菲特拉特作品中使用的复合词汇展开研究,重点分析其作为表达社会政治关系的语义词汇群体的特征,为理解相关文本的社会政治内涵提供数据支持。 文件详解 文件名称:Mirzatillayeva Sayyoraxon Zokirjon qizi.pdf 文件格式:PDF...
    packageimg
  • 东印度尼西亚语言LexiRumah数据库v3_0_1

    2025年12月22日 30 26 22

    数据集概述 该数据集是东印度尼西亚语言的LexiRumah数据库,版本为v3.0.1。以压缩包形式存储,包含相关语言数据,为研究东印度尼西亚语言提供数据支持。 文件详解 文件名称:lessersunda/lexirumah-data-v3.0.1.zip 文件格式:ZIP(.zip)...
    packageimg
  • 北京大学1964年汉语方言词汇CLDF数据集

    2025年12月21日 30 175 121

    数据集概述 该数据集是基于北京大学1964年《汉语方言词汇》的CLDF格式数据集,包含汉语方言词汇相关内容,以压缩包形式存储,为方言词汇研究提供结构化数据支持。 文件详解 文件名称:lexibank/beidasinitic-v5.1.zip 文件格式:ZIP压缩包(.zip)...
    packageimg
  • IN02063_Maligaon_Based_石刻铭文翻译文本完整数据

    2025年12月20日 30 71 47

    数据集概述 该数据集包含IN02063 Maligaon石刻铭文的翻译文件,通过PDF和DOCX两种格式呈现,为研究该石刻铭文的内容提供了可访问的文本资源。 文件详解 文件名称: IN02063 CVII Maligaon Inscription.pdf 文件格式: PDF (.pdf) 内容说明: Maligaon石刻铭文的翻译文档,以PDF格式存储...
    packageimg
  • 世界语言结构地图集在线版2014

    2025年12月20日 30 55 36

    数据集概述 本数据集为2014年7月发布的《世界语言结构地图集在线版》压缩包,包含全球语言结构特征的相关数据,是研究语言多样性与类型学的重要资源。 文件详解 文件名称: wals3-v2014.2.zip 文件格式: ZIP压缩包 内容说明: 压缩包内包含《世界语言结构地图集在线版》2014年版本的相关数据文件,具体内容需解压后查看 数据来源 Max...
    packageimg
  • 未提供_Lower_Fungom_Missong_Based_语言研究词汇变异完整数据

    2025年12月19日 30 145 123

    数据集概述 该数据集为Lower Fungom地区Missong语言的225词表,Missong属于Yemne-Kimbi语组,具有声调及名词前缀特征。词表记录了两位咨询者的词汇变异,变异与社会语言学特征差异相关。 文件详解 文件名称:...
    packageimg
  • 尼泊尔部分语言词汇表数据集1973

    2025年12月19日 30 166 18

    数据集概述 该数据集是基于Hale 1973年《尼泊尔部分语言词汇表》衍生的CLDF格式数据集,包含尼泊尔特定语言的词汇信息,为语言研究提供结构化数据支持。 文件详解 文件名称:lexibank/halenepal-v4.0.zip 文件格式:ZIP压缩包(.zip)...
    packageimg
  • 基于2015年Castro_水语方言研究_的CLDF数据集

    2025年12月18日 30 97 39

    数据集概述 该数据集是基于2015年Castro《水语方言研究》的CLDF格式数据集,核心内容为水语方言相关研究数据,以压缩包形式存储,未提供具体内容预览。 文件详解 文件名称: lexibank/castrosui-v3.1.zip 文件格式: ZIP压缩包 内容说明: 未提供文件内部字段或内容预览,仅包含1个压缩包文件 数据来源 Castro,...
    packageimg
  • XOJA_Based_作品词汇特征分析完整数据

    2025年12月16日 30 146 92

    数据集概述 本数据集包含一份关于XOJA作品词汇特征的PDF文档,聚焦XOJA作品的词汇相关研究内容,为相关语言或文学领域的分析提供资料支持。 文件详解 文件名称: Danabekov Ozodbek Imomali o‘g‘li.pdf 文件格式: PDF (.pdf) 文件内容: 文档围绕XOJA作品的词汇特征展开,具体内容需查阅PDF文件获取...
    packageimg
  • AUTOTYP_Database_1_1_1_Based_语言类型学研究数据完整集合

    2025年12月16日 30 30 18

    数据集概述 该数据集是AUTOTYP大型研究项目的成果,聚焦语言类型学的定量与定性研究。此版本包含AUTOTYP数据库的完整原始数据、元数据、聚合数据集及聚合脚本,版本为1.1.1,主要优化了MaximallyInflectedVerbSynthesis数据集的CLDF导出功能。 文件详解 文件名称: autotyp-data-v.1.1.1.zip...
    packageimg
  • KPAAMCAM_NTs_MASHI_4BAA_5NCM_Based_贝姆布尔诺Lower_Fungom_Mashi词汇表完整数据

    2025年12月15日 30 57 50

    数据集概述 该数据集包含一份关于Mashi语言的225个词汇表文档。Mashi是一种属于Yemne-Kimbi语支的语言变体,主要分布在喀麦隆西北部Menchum区Fungom分区的Lower Fungom地区,为研究该语言的词汇特征提供基础数据。 文件详解 文件名称:...
    packageimg
  • 古典藏文标注语料库第一部分_基于BDRC数字化文本的分词版本

    2025年12月14日 30 29 4

    数据集概述 本数据集是基于佛教数字资源中心(BDRC)数字化文本集的古典藏文分词版本语料库,采用TiMBL的基于记忆的标注器进行词性标注,未经过后处理或人工校正,包含12个压缩文件。 文件详解 该数据集包含12个压缩文件,具体说明如下: -...
    packageimg
  • 贝纳方言调查数据集2013

    2025年12月14日 30 210 4

    数据集概述 该数据集是基于2013年Mitterhofer的《贝纳方言调查》的CLDF格式数据集,聚焦贝纳方言词汇表分析,为研究贝纳方言提供结构化数据支持。 文件详解 文件名称:lexibank/mitterhoferbena-v3.1.zip 文件格式:ZIP压缩包...
    packageimg
  • 乌兹别克语语言描述数据集

    2025年12月14日 30 19 2

    数据集概述 本数据集包含一份关于乌兹别克语语言描述的PDF文档,文档围绕乌兹别克语的词语、短语及其语言学特征展开,为乌兹别克语语言研究提供基础资料。 文件详解 文件名称: Ибрагимова Муқаддас Абдуллаевна.pdf 文件格式: PDF (.pdf) 文件内容:...
    packageimg
  • 乌兹别克语中_BOBURNOMA_使用的度量单位词汇和句法特征研究

    2025年12月14日 30 91 14

    数据集概述 本数据集聚焦于乌兹别克语典籍《BOBURNOMA》中所使用的度量单位,对其词汇特征和句法特征进行研究。 文件详解 文件名称: Sayyora Shodmonova.pdf 文件格式: PDF (.pdf) 文件内容: 该文档围绕《BOBURNOMA》中度量单位的词汇构成、语法结构等特征展开分析,具体内容需通过文档阅读获取。 适用场景...
    packageimg
  • 朴素贝叶斯情感分类器生成数据集2023

    2025年12月14日 30 26 12

    数据集概述 本数据集是通过朴素贝叶斯分类器算法运行生成的情感分析相关数据,包含词汇表中的单词及其出现次数、似然比等统计信息,以及对应的可视化图表,为情感分类模型的词汇特征分析提供支持。 文件详解 词汇统计文件(CSV格式):...
    packageimg
  • CLDF格式南钦语语言笔记数据集1988

    2025年12月14日 30 41 1

    数据集概述 该数据集为CLDF格式,源自1988年Helga So-Hartmann发表的《南钦语语言笔记》,收录了南钦语相关语言学研究内容,为南钦语语言特征分析提供结构化数据支持。 文件详解 文件名称:lexibank/sohartmannchin-v3.1.zip 文件格式:ZIP压缩包(.zip)...
    packageimg