找到73个数据集

标签: 语法特征

过滤结果
  • IN02082_Draft_Epidoc_梵语铭文XML数据

    2026年1月29日 30 165 79

    数据集概述 本数据集为IN02082 Balambu Indramati铭文的梵语XML文件,是尚未纳入Siddham档案的Epidoc格式草稿版本。数据不含元数据,聚焦于铭文的梵语文本内容,为铭文研究提供结构化的数字化文本资源。 文件详解 文件名称:IN02082.xml 文件格式:XML...
    packageimg
  • La_Pola_Siero_阿斯图里亚斯地图第2问方言语料数据

    2026年1月29日 30 181 161

    数据集概述 本数据集为阿斯图里亚斯地图第2问相关的La Pola Siero方言语料,包含一份文档文件,聚焦该方言在特定问题场景下的语言表达,为方言研究提供原始语料支持。 文件详解 文件名称:Mapa de Asturias.Pregunta2.docx 文件格式:DOCX...
    packageimg
  • IN01054_Based_拉维瓦尔曼第11年哈尔西敕令梵语XML数据

    2026年1月26日 30 201 181

    数据集概述 本数据集包含IN01054号拉维瓦尔曼第11年哈尔西敕令的梵语文本XML文件,无元数据信息。数据集仅含一个文件,无目录层级划分,未进行训练/测试、数据/标签或原始/处理数据的拆分,文件类型单一为XML格式。 文件详解 文件名称:IN01054.xml 文件格式:XML...
    packageimg
  • IN01027_Based_Hiresakuna梵语授权文书数字化数据

    2026年1月26日 30 200 113

    数据集概述 本数据集为IN01027号Hireśakuna授权文书的梵语XML文件,记录了Mṛgeśavarman统治第八年的授权内容,未包含元数据。数据集仅含一个文件,用于古文献数字化保存与研究。 文件详解 文件名称:IN01027.xml 文件格式:XML...
    packageimg
  • WoPoss_Source_拉丁语模态演变研究语料库标注样本_2022

    2026年1月22日 30 103 42

    数据集概述 本数据集是WoPoss团队标注的WoPoss语料库样本,包含五部拉丁语经典文本:M. Minucius Felix的《Octavius》、P. Ovidius Naso的《Metamorphoses》(第一卷)、G. Petronius Arbiter的《Satyricon》、Q. S. F. Tertullianus的《De...
    packageimg
  • La_Pola_Siero_Based_阿斯图里亚斯地图第五问口语语料数据

    2026年1月21日 30 31 0

    数据集概述 本数据集为关于阿斯图里亚斯地图第五问的口语语料数据,来自La Pola Siero地区的口语语料库。数据集包含1个文件,无目录结构,未划分训练/测试集、数据/标签集或原始/处理集,主要文件类型为DOCX格式。 文件详解 文件名称:Mapa de Asturias.Pregunta5.docx 文件格式:DOCX...
    packageimg
  • La_Pola_Siero_Based_阿斯图里亚斯地图问题8方言语料数据

    2026年1月21日 30 67 66

    数据集概述 本数据集为阿斯图里亚斯地图相关的问题8语料,基于La Pola Siero方言构建,包含1个文档文件,无训练/测试、数据/标签或原始/处理数据拆分,文件类型单一为docx格式。 文件详解 文件名称:Mapa de Asturias.Pregunta8.docx 文件格式:docx...
    packageimg
  • Source_Code_Classifications_编程语言分类代码数据集

    2026年1月19日 30 56 18

    数据集概述 本数据集为编程语言分类代码数据集,核心内容是与编程语言分类相关的源代码数据,以压缩包形式提供,未包含训练测试、数据标签或原始处理等划分,无额外说明文档或内容预览。 文件详解 主文件 文件名称:dataset.zip 文件格式:ZIP...
    packageimg
  • Wangerooge_Frisian_Based_已灭绝东弗里斯兰语录音转录数据集

    2026年1月15日 30 144 40

    数据集概述 本数据集包含已灭绝的东弗里斯兰语——Wangerooge弗里斯兰语的转录录音资料,总时长34分钟。录音于1924-1927年采集,涉及4位母语使用者,2024-25年完成转录,提供音频及对应的文本转录与英文翻译,是该濒危语言研究的重要资料。 文件详解 压缩包文件(Archive files) 文件名称:包括rec-br-...
    packageimg
  • IN02094_Sanskrit_Epidoc格式Kumbhesvara铭文草稿数据

    2026年1月14日 30 56 40

    数据集概述 本数据集为IN02094 Kumbhesvara铭文的梵语XML文件,采用Epidoc格式草稿版,不含元数据,计划纳入“Siddham”档案。数据集仅包含一个文件,用于记录和保存该古铭文的数字化文本内容。 文件详解 文件名称:IN02094.xml 文件格式:XML...
    packageimg
  • IN02084_源文件_悉达摩字母档案_湿婆德瓦二世_索纳古提石刻铭文梵语XML草稿版

    2026年1月14日 30 173 59

    数据集概述 本数据集包含IN02084编号的Sivadeva II时期Sonaguthi石刻铭文的梵语XML文件,为Epidoc格式草稿版,将纳入“Siddham”档案。数据无元数据,仅含1个XML文件,聚焦石刻铭文的数字化文本内容,用于梵语铭文文献的研究与存档。 文件详解 文件名称:IN02084.xml 文件格式:XML...
    packageimg
  • Multi_CAST_Based_Kalamang语言口语文本标注语料库数据_v2311

    2026年1月13日 30 21 11

    数据集概述 本数据集为Multi-CAST多语言口语文本标注语料库的一部分,包含Kalamang语言的标注口语文本数据。数据集由Eline Visser于2023年贡献,属于Multi-CAST语料库的2311版本,旨在为语言学研究提供标准化的多语言口语资源。 文件详解 文件名称:Multi-CAST/mckalamang-v2311.zip...
    packageimg
  • Cáo_Mò_Zhī_Zhèn_Based_曹沫之陳竹简文献数字版本CLDF数据_2025

    2026年1月13日 30 26 9

    数据集概述 本数据集提供支撑《曹沫之陳》数字版本的CLDF格式数据,由Pulini和List于2025年发布。数据用于填充该古代汉语竹简文献的数字化版本,是研究先秦文献数字化标注方法的基础资源。 文件详解 文件名称:caomozhizhen-v0.2.zip 文件格式:ZIP(压缩包)...
    packageimg
  • IN02049_Sanskrit_Gungucha碑铭Epidoc格式XML数据_Draft

    2026年1月12日 30 174 161

    数据集概述 本数据集为加德满都Gungucha碑铭(编号IN02049)的梵语文本XML文件,采用Epidoc格式的草稿版本,将纳入"Siddham"档案。数据包含碑铭的数字化文本内容,无元数据,是研究该碑铭文献的基础数字化资源。 文件详解 文件名称:IN02049.xml 文件格式:XML...
    packageimg
  • IN02009_Draft_Epidoc_Edition_Sivalinga铭文梵语XML数据

    2026年1月12日 30 162 53

    数据集概述 本数据集为编号IN02009的Sivalinga铭文数字化文件,该铭文位于Daksinamurti神庙附近。数据以梵语XML格式存储,为未添加元数据的Epidoc标准草稿版本,计划纳入"Siddham"档案,核心记录铭文文本内容。 文件详解 文件名称:IN02009.xml 文件格式:XML...
    packageimg
  • IN02047_Siddham_Deopatan梵语铭文Epidoc格式XML数据_draft

    2026年1月11日 30 163 33

    数据集概述 本数据集为IN02047 Deopatan铭文的初步Epidoc格式梵语XML文件,不含元数据,计划纳入“Siddham”档案。数据核心为该铭文的数字化文本,支持铭文文献的标准化存储与研究,仅包含一个文件。 文件详解 文件名称:IN02047.xml 文件格式:XML...
    packageimg
  • Perseids_Artemidorus_解梦_第五卷古希腊标注树库数据_UNESP_trees

    2026年1月8日 30 154 142

    数据集概述 本数据集为古希腊文献《解梦》(Oneirocritica)第五卷的标注树库,包含人工标注的句法树结构。数据基于古希腊依存树库规范构建,是巴西圣保罗州立大学阿拉拉夸拉分校数字古典学开放项目的一部分,可用于古希腊文献的句法分析与数字人文研究。 文件详解 文件名称:包括artem-onir-5.61-5.70.xml、artem-...
    packageimg
  • IN01028_Sanskrit_Based_Kadamba国王Malavalli铭文梵语文本数据

    2026年1月7日 30 134 74

    数据集概述 本数据集包含编号为IN01028的古印度Kadamba国王Malavalli铭文的梵语XML文件。该文件记录了铭文的梵语文本内容,未包含元数据,是研究Kadamba王朝历史、古印度铭文和梵语文学的数字化资料。数据集仅含一个文件。 文件详解 文件名称:IN01028.xml 文件格式:XML...
    packageimg
  • Distributive_Plural_Singular_Based跨语言分配性单复数对比调查数据

    2026年1月6日 30 115 75

    数据集概述 本数据集包含跨语言分配性单复数对比调查数据,涵盖强制选择和李克特量表两种调查形式,涉及英语、捷克语、德语、波兰语四种语言,共包含两个文件。 文件详解 强制选择调查数据 文件名称:Forced-choice_KR.xlsx 文件格式:XLSX...
    packageimg
  • IN02072_Siddham_Based_Narendradeva耶恩加希提铭文梵语XML草稿数据

    2026年1月5日 30 13 1

    数据集概述 本数据集为IN02072号Narendradeva耶恩加希提铭文的梵语XML文件,是待纳入Siddham档案的Epidoc格式草稿版本,不含元数据。数据集仅包含1个文件,聚焦于该古铭文的数字化文本记录。 文件详解 文件名称:IN02072.xml 文件格式:XML...
    packageimg