找到37个数据集

格式: ZIP 标签: 语法结构

过滤结果
  • Narada_Momotaro_Based_奈良田方言桃太郎故事音声文字化数据_20240502

    2026年1月8日 30 21 3

    数据集概述 本数据集包含山梨县早川町奈良田方言翻译的传统故事《桃太郎》开头部分的音声及文字化内容,记录了该地方言对经典文本的演绎形式,为方言文化研究提供原始素材。 文件详解 文件名称:narada_momotaro_20240502.zip 文件格式:ZIP...
    packageimg
  • 捷克失语症患者言语与手势关系研究数据_女性跨皮质运动性失语症患者雅内卡_Janecka_的转录数据

    2026年1月7日 30 85 58

    数据集概述 本数据集为捷克视角下经皮质运动性失语女性患者的言语转录数据,内容为患者复述卡通《小羊肖恩》故事的记录,用于探索失语症患者言语与手势的关系。数据集仅包含一份文档文件。 文件详解 文件名称:transcription_female_transcortical_motor_aphasia_Janecka.docx 文件格式:DOCX...
    packageimg
  • IN02035_Sanskrit_Based_Tokha碑铭梵语XML数据_Draft_Epidoc

    2026年1月4日 30 50 15

    数据集概述 本数据集包含IN02035号Tokha碑铭的梵语XML文件,为Epidoc格式的草稿版本,计划纳入"Siddham"档案。数据无元数据,聚焦碑铭文本内容的结构化存储,可用于梵语碑铭的数字化研究与文本分析,共包含1个文件。 文件详解 文件名称:IN02035.xml 文件格式:XML...
    packageimg
  • 内夫梅南德尔_Nevmenandr_创作的丹尼尔_Dani_人工语言的生日纪念文本语法数据_v1_0

    2026年1月4日 30 36 35

    数据集概述 本数据集为纪念М.А. Даниэля生日的人工语言相关数据,包含人工语言的文本内容及语法描述,整体打包为一个压缩文件,无额外目录层级或数据拆分结构。 文件详解 文件名称:nevmenandr/artlang-dani-el-v1.0.0.zip 文件格式:ZIP 字段映射介绍:压缩包内包含纪念М.А....
    packageimg
  • Schriftbelege_Hunsrik_xraywe_Lindenfelser_书面证据分析数据

    2026年1月4日 30 97 58

    数据集概述 本数据集为论文“Hunsrik xraywe”的分析语料,包含Facebook群组“Hunsrik Xprooch – Plat Taytx”中一周(2021年7月)的350条帖子及评论,共2250个词元,为Hunsrik语言的书面证据分析提供结构化数据支持。 文件详解...
    packageimg
  • IN02079_Based_Siddham档案待整合Vajraghar石刻铭文梵语XML数据_draft

    2025年12月31日 30 78 54

    数据集概述 本数据集为IN02079 Vajraghar石刻铭文的梵语XML文件,属于Epidoc格式的草稿版本,计划整合至Siddham档案。数据包含石刻铭文的梵语文本内容,无附加元数据,是研究古代梵语铭文的基础文本资源。 文件详解 文件名称:IN02079.xml 文件格式:XML...
    packageimg
  • Case_marked_subordinate_clauses_Based_欧洲19种语言从句格标记数据库

    2025年12月31日 30 6 1

    数据集概述 本数据集包含欧洲19种语言中从句格标记的实例,是“Case-marked subordinate clauses”项目的一部分。该项目由马萨里克大学和日内瓦大学的研究人员合作开展,旨在描述和解释欧洲语言中从句格标记结构,以增进对该语法现象的整体理解。 文件详解 文件名称:case_marked_clauses.xlsx 文件格式:XLSX...
    packageimg
  • 哥廷根印度语言电子文本注册库_罗摩衍那数据集

    2025年12月25日 30 76 30

    数据集概述 本数据集是哥廷根印度语言电子文本注册库(GRETIL)中关于《罗摩衍那》(Rāmāyaṇa)的电子文本集合,包含多个章节或版本的文本文件,为印度古典文学研究提供基础资料。 文件详解 该数据集由13个HTML格式文件组成,具体如下: -...
    packageimg
  • 印度语言电子文本哥廷根登记册_普拉蒂萨基亚集

    2025年12月23日 30 180 38

    数据集概述 本数据集是印度语言电子文本哥廷根登记册(GRETIL)中的普拉蒂萨基亚(PRATISAKHYA)相关文本集合,包含两篇印度语言电子文本,均以网页格式存储,为研究印度语言文本提供基础资料。 文件详解 文件名称: niruktau.htm:格式为.htm,具体内容未提供预览,推测为印度语言相关电子文本。 文件名称:...
    packageimg
  • 哥廷根印度语言电子文本注册吠陀数据集

    2025年12月23日 30 12 0

    数据集概述 本数据集是哥廷根印度语言电子文本注册(GRETIL)中关于吠陀(VEDA)的电子文本集合,包含37个HTML格式文件,主要为吠陀相关文本内容,未划分训练测试集、数据标签或原始/处理数据,为印度语言及吠陀文本研究提供基础资料。 文件详解 该数据集包含37个HTML格式文件,具体说明如下: - 文件类型: 所有文件均为.htm格式,占比100%...
    packageimg
  • 伊戈尔远征记_平行语料库中的附着词研究文档

    2025年12月22日 30 118 55

    数据集概述 本数据集为一份文档,内容源于2018年12月21日纪念Andrej A. Zalizniak的主题报告,围绕俄罗斯历史语言学展开,重点探讨Zalizniak提出的附着词内部排序模板原则及不定式结构中主格的描述,并通过历史语料库验证其理论,含《伊戈尔远征记》平行语料库中附着词及附着词簇频率的初步调查。 文件详解 文件名称:...
    packageimg
  • 波洛利苏姆古罗马墓地墓碑铭文数据集

    2025年12月22日 30 46 19

    数据集概述 本数据集包含1868年在古罗马城市波洛利苏姆(POROLISSVM)墓地发现的墓碑铭文资料,涵盖拉丁原文、罗马尼亚语翻译及相关文件,为研究古罗马丧葬文化和铭文提供基础数据。 文件详解 核心模型文件: 3b52721198094b478866d6fa1a073d9b.glb: GLB格式3D模型文件,可能包含墓碑的三维模型数据 图片文件:...
    packageimg
  • 古典藏语标注语料库第二部分_词性标注版

    2025年12月22日 30 94 27

    数据集概述 本数据集是基于佛教数字资源中心(BDRC)数字化文本集构建的古典藏语词性标注语料库第二部分,使用TiMBL的基于记忆的标注器(Memory-Based Tagger)完成标注,未经过后处理或人工校正。 文件详解 压缩文件集(共12个,均为.zip格式):...
    packageimg
  • 拉维瓦尔曼的昆塔加尼铭文第十八号_公元12年

    2025年12月20日 30 83 33

    数据集概述 该数据集为编号IN01023的拉维瓦尔曼时期昆塔加尼铭文第十八号(公元12年)的文献资料,源自早期卡丹巴王朝铭文研究,包含铭文内容及相关研究记录,为历史铭文研究提供原始文献支持。 文件详解 文件名称: IN01023 No.18 Plate XVIII Kuṇṭagaṇi Plates of Ravivarman, Year 12.pdf...
    packageimg
  • Zenodo_Komnzo_Text_Corpus_Based_202406语言语料库完整数据

    2025年12月20日 30 8 7

    数据集概述 本数据集包含最新版本的Komnzo文本语料库压缩文件,由Christian Döhler为其博士语言记录项目录制,记录了新几内亚南部的Komnzo语言相关材料。 文件详解 文件名称: Komnzo-2024-06.zip 文件格式: ZIP(压缩文件) 内容说明:...
    packageimg
  • IN02030_Golmadhitole_Based_铭文翻译文档研究完整数据

    2025年12月20日 30 135 32

    数据集概述 本数据集包含IN02030 Golmadhitole铭文的翻译文件,以文档形式呈现铭文内容,为研究该铭文提供直接的文本资料。 文件详解 该数据集包含两个文档文件,具体说明如下: - 文件名称: IN02030 LVI Golmadhitol (Bhadgaon).pdf - 文件格式: PDF (.pdf) - 内容说明:...
    packageimg
  • 德语否定词分类及其在句子中的应用

    2025年12月19日 30 186 95

    数据集概述 本数据集围绕德语否定词的分类及其在句子中的应用展开,包含一份相关主题的文档,为研究德语否定词的语言学特征及使用场景提供基础资料。 文件详解 文件名称:Адхам Бердимуродов Мусурмонович.pdf 文件格式:PDF(.pdf) 内容说明:该文档为德语否定词分类及其在句子中应用的相关研究资料,具体内容需查阅文档正文。...
    packageimg
  • 带括号插入成分的复杂句的语言风格特征数据集

    2025年12月18日 30 174 35

    数据集概述 本数据集围绕带括号插入成分的复杂句作为语言风格展开研究,探讨其语言风格特征。核心为一份PDF格式文档,为语言风格学领域相关研究提供数据支撑。 文件详解 该数据集包含一个PDF格式的文档文件,具体说明如下: - 文件名称: М.Г.Хошимов.pdf - 文件格式: PDF (.pdf) - 文件内容:...
    packageimg
  • 乌兹别克语与土耳其语句子成分比较描述

    2025年12月15日 30 180 98

    数据集概述 本数据集围绕乌兹别克语与土耳其语的句子成分展开比较描述,通过单篇PDF文档呈现相关语言对比分析内容,为研究突厥语族语言结构差异提供基础资料。 文件详解 文件名称: I.Yoqubov .pdf 文件格式: PDF (.pdf) 内容说明: 文档围绕乌兹别克语与土耳其语的句子成分进行比较描述,具体字段或内容需通过PDF文档内容解析获取...
    packageimg
  • 乌兹别克语语言描述数据集

    2025年12月14日 30 207 147

    数据集概述 本数据集包含一份关于乌兹别克语语言描述的PDF文档,文档围绕乌兹别克语的词语、短语及其语言学特征展开,为乌兹别克语语言研究提供基础资料。 文件详解 文件名称: Ибрагимова Муқаддас Абдуллаевна.pdf 文件格式: PDF (.pdf) 文件内容:...
    packageimg