找到36个数据集

标签: 语法结构

过滤结果
  • IN02035_Sanskrit_Based_Tokha碑铭梵语XML数据_Draft_Epidoc

    2026年1月4日 30 127 37

    数据集概述 本数据集包含IN02035号Tokha碑铭的梵语XML文件,为Epidoc格式的草稿版本,计划纳入"Siddham"档案。数据无元数据,聚焦碑铭文本内容的结构化存储,可用于梵语碑铭的数字化研究与文本分析,共包含1个文件。 文件详解 文件名称:IN02035.xml 文件格式:XML...
    packageimg
  • 内夫梅南德尔_Nevmenandr_创作的丹尼尔_Dani_人工语言的生日纪念文本语法数据_v1_0

    2026年1月4日 30 104 75

    数据集概述 本数据集为纪念М.А. Даниэля生日的人工语言相关数据,包含人工语言的文本内容及语法描述,整体打包为一个压缩文件,无额外目录层级或数据拆分结构。 文件详解 文件名称:nevmenandr/artlang-dani-el-v1.0.0.zip 文件格式:ZIP 字段映射介绍:压缩包内包含纪念М.А....
    packageimg
  • Schriftbelege_Hunsrik_xraywe_Lindenfelser_书面证据分析数据

    2026年1月4日 30 196 16

    数据集概述 本数据集为论文“Hunsrik xraywe”的分析语料,包含Facebook群组“Hunsrik Xprooch – Plat Taytx”中一周(2021年7月)的350条帖子及评论,共2250个词元,为Hunsrik语言的书面证据分析提供结构化数据支持。 文件详解...
    packageimg
  • IN02079_Based_Siddham档案待整合Vajraghar石刻铭文梵语XML数据_draft

    2025年12月31日 30 150 147

    数据集概述 本数据集为IN02079 Vajraghar石刻铭文的梵语XML文件,属于Epidoc格式的草稿版本,计划整合至Siddham档案。数据包含石刻铭文的梵语文本内容,无附加元数据,是研究古代梵语铭文的基础文本资源。 文件详解 文件名称:IN02079.xml 文件格式:XML...
    packageimg
  • Case_marked_subordinate_clauses_Based_欧洲19种语言从句格标记数据库

    2025年12月31日 30 68 53

    数据集概述 本数据集包含欧洲19种语言中从句格标记的实例,是“Case-marked subordinate clauses”项目的一部分。该项目由马萨里克大学和日内瓦大学的研究人员合作开展,旨在描述和解释欧洲语言中从句格标记结构,以增进对该语法现象的整体理解。 文件详解 文件名称:case_marked_clauses.xlsx 文件格式:XLSX...
    packageimg
  • 哥廷根印度语言电子文本注册库_罗摩衍那数据集

    2025年12月25日 30 119 98

    数据集概述 本数据集是哥廷根印度语言电子文本注册库(GRETIL)中关于《罗摩衍那》(Rāmāyaṇa)的电子文本集合,包含多个章节或版本的文本文件,为印度古典文学研究提供基础资料。 文件详解 该数据集由13个HTML格式文件组成,具体如下: -...
    packageimg
  • 印度语言电子文本哥廷根登记册_普拉蒂萨基亚集

    2025年12月23日 30 27 2

    数据集概述 本数据集是印度语言电子文本哥廷根登记册(GRETIL)中的普拉蒂萨基亚(PRATISAKHYA)相关文本集合,包含两篇印度语言电子文本,均以网页格式存储,为研究印度语言文本提供基础资料。 文件详解 文件名称: niruktau.htm:格式为.htm,具体内容未提供预览,推测为印度语言相关电子文本。 文件名称:...
    packageimg
  • 哥廷根印度语言电子文本注册吠陀数据集

    2025年12月23日 30 10 2

    数据集概述 本数据集是哥廷根印度语言电子文本注册(GRETIL)中关于吠陀(VEDA)的电子文本集合,包含37个HTML格式文件,主要为吠陀相关文本内容,未划分训练测试集、数据标签或原始/处理数据,为印度语言及吠陀文本研究提供基础资料。 文件详解 该数据集包含37个HTML格式文件,具体说明如下: - 文件类型: 所有文件均为.htm格式,占比100%...
    packageimg
  • 伊戈尔远征记_平行语料库中的附着词研究文档

    2025年12月22日 30 145 124

    数据集概述 本数据集为一份文档,内容源于2018年12月21日纪念Andrej A. Zalizniak的主题报告,围绕俄罗斯历史语言学展开,重点探讨Zalizniak提出的附着词内部排序模板原则及不定式结构中主格的描述,并通过历史语料库验证其理论,含《伊戈尔远征记》平行语料库中附着词及附着词簇频率的初步调查。 文件详解 文件名称:...
    packageimg
  • 波洛利苏姆古罗马墓地墓碑铭文数据集

    2025年12月22日 30 156 113

    数据集概述 本数据集包含1868年在古罗马城市波洛利苏姆(POROLISSVM)墓地发现的墓碑铭文资料,涵盖拉丁原文、罗马尼亚语翻译及相关文件,为研究古罗马丧葬文化和铭文提供基础数据。 文件详解 核心模型文件: 3b52721198094b478866d6fa1a073d9b.glb: GLB格式3D模型文件,可能包含墓碑的三维模型数据 图片文件:...
    packageimg
  • 古典藏语标注语料库第二部分_词性标注版

    2025年12月22日 30 151 60

    数据集概述 本数据集是基于佛教数字资源中心(BDRC)数字化文本集构建的古典藏语词性标注语料库第二部分,使用TiMBL的基于记忆的标注器(Memory-Based Tagger)完成标注,未经过后处理或人工校正。 文件详解 压缩文件集(共12个,均为.zip格式):...
    packageimg
  • 拉维瓦尔曼的昆塔加尼铭文第十八号_公元12年

    2025年12月20日 30 129 128

    数据集概述 该数据集为编号IN01023的拉维瓦尔曼时期昆塔加尼铭文第十八号(公元12年)的文献资料,源自早期卡丹巴王朝铭文研究,包含铭文内容及相关研究记录,为历史铭文研究提供原始文献支持。 文件详解 文件名称: IN01023 No.18 Plate XVIII Kuṇṭagaṇi Plates of Ravivarman, Year 12.pdf...
    packageimg
  • Zenodo_Komnzo_Text_Corpus_Based_202406语言语料库完整数据

    2025年12月20日 30 170 167

    数据集概述 本数据集包含最新版本的Komnzo文本语料库压缩文件,由Christian Döhler为其博士语言记录项目录制,记录了新几内亚南部的Komnzo语言相关材料。 文件详解 文件名称: Komnzo-2024-06.zip 文件格式: ZIP(压缩文件) 内容说明:...
    packageimg
  • IN02030_Golmadhitole_Based_铭文翻译文档研究完整数据

    2025年12月20日 30 177 27

    数据集概述 本数据集包含IN02030 Golmadhitole铭文的翻译文件,以文档形式呈现铭文内容,为研究该铭文提供直接的文本资料。 文件详解 该数据集包含两个文档文件,具体说明如下: - 文件名称: IN02030 LVI Golmadhitol (Bhadgaon).pdf - 文件格式: PDF (.pdf) - 内容说明:...
    packageimg
  • 德语否定词分类及其在句子中的应用

    2025年12月19日 30 168 80

    数据集概述 本数据集围绕德语否定词的分类及其在句子中的应用展开,包含一份相关主题的文档,为研究德语否定词的语言学特征及使用场景提供基础资料。 文件详解 文件名称:Адхам Бердимуродов Мусурмонович.pdf 文件格式:PDF(.pdf) 内容说明:该文档为德语否定词分类及其在句子中应用的相关研究资料,具体内容需查阅文档正文。...
    packageimg
  • 带括号插入成分的复杂句的语言风格特征数据集

    2025年12月18日 30 9 6

    数据集概述 本数据集围绕带括号插入成分的复杂句作为语言风格展开研究,探讨其语言风格特征。核心为一份PDF格式文档,为语言风格学领域相关研究提供数据支撑。 文件详解 该数据集包含一个PDF格式的文档文件,具体说明如下: - 文件名称: М.Г.Хошимов.pdf - 文件格式: PDF (.pdf) - 文件内容:...
    packageimg
  • 乌兹别克语与土耳其语句子成分比较描述

    2025年12月15日 30 195 168

    数据集概述 本数据集围绕乌兹别克语与土耳其语的句子成分展开比较描述,通过单篇PDF文档呈现相关语言对比分析内容,为研究突厥语族语言结构差异提供基础资料。 文件详解 文件名称: I.Yoqubov .pdf 文件格式: PDF (.pdf) 内容说明: 文档围绕乌兹别克语与土耳其语的句子成分进行比较描述,具体字段或内容需通过PDF文档内容解析获取...
    packageimg
  • 乌兹别克语语言描述数据集

    2025年12月14日 30 205 137

    数据集概述 本数据集包含一份关于乌兹别克语语言描述的PDF文档,文档围绕乌兹别克语的词语、短语及其语言学特征展开,为乌兹别克语语言研究提供基础资料。 文件详解 文件名称: Ибрагимова Муқаддас Абдуллаевна.pdf 文件格式: PDF (.pdf) 文件内容:...
    packageimg
  • 乌兹别克语中_BOBURNOMA_使用的度量单位词汇和句法特征研究

    2025年12月14日 30 118 112

    数据集概述 本数据集聚焦于乌兹别克语典籍《BOBURNOMA》中所使用的度量单位,对其词汇特征和句法特征进行研究。 文件详解 文件名称: Sayyora Shodmonova.pdf 文件格式: PDF (.pdf) 文件内容: 该文档围绕《BOBURNOMA》中度量单位的词汇构成、语法结构等特征展开分析,具体内容需通过文档阅读获取。 适用场景...
    packageimg
  • YZQ讲述的羌族笑话录音与转写数据集_YH_066

    2025年12月12日 30 173 159

    数据集概述 该数据集包含由YZQ讲述的一则羌族笑话的录音及转写文件,以YH-066为标识,涵盖音频、转写标注、预览网页等多种格式文件,为羌族语言文化相关研究提供原始资料支持。 文件详解 文件名称: YH-066.eaf,文件格式: EAF (.eaf),可能为音频转写标注文件,用于记录笑话内容的文本与音频时间对齐信息 文件名称:...
    packageimg