找到43个数据集

标签: 文本结构

过滤结果
  • IN02090_Sanskrit_Epidoc格式梵语铭文数据

    2026年2月9日 30 165 151

    数据集概述 本数据集为IN02090 Naksal Narayana Chour铭文的梵语XML文件,采用Epidoc格式的草稿版本,不含元数据,将被纳入“Siddham”档案。数据集仅包含1个XML文件,用于记录该铭文的梵语文本内容。 文件详解 文件名称:IN02090.xml 文件格式:XML...
    packageimg
  • Andromaque_Tragedie_戏剧作品XML元数据

    2026年2月8日 30 175 10

    数据集概述 本数据集包含戏剧作品《Andromaque Tragédie》的XML格式文件,无额外目录结构或数据拆分,核心为单份戏剧相关元数据文件,可用于戏剧文学的文本分析或元数据研究。 文件详解 核心文件:EMOTHE0719_AndromaqueTragedie.xml 文件格式:XML 内容说明:包含《Andromaque...
    packageimg
  • Le_Misanthrope喜剧XML格式数据

    2026年2月1日 30 144 93

    数据集概述 本数据集包含一部名为《Le Misanthrope》的喜剧相关数据,以单一XML文件形式呈现,未进行训练测试、数据标签或原始处理等划分,主要用于戏剧文学相关的文本分析场景。 文件详解 文件名称:EMOTHE0720_LeMisanthropeComedie.xml 文件格式:XML 字段映射介绍:包含《Le...
    packageimg
  • NARRATIVAS_DE_ENTERRO_丧葬叙事文本转录数据

    2026年1月28日 30 16 3

    数据集概述 本数据集为丧葬叙事文本的转录数据,包含一份文档文件,记录了与丧葬相关的叙事内容,为研究丧葬叙事的文本特征、文化内涵等提供基础资料。 文件详解 文件名称:NARRATIVAS DE ENTERRO (1).docx 文件格式:DOCX 字段映射介绍:文档为丧葬叙事文本的转录内容,具体字段因无预览无法详细说明,推测包含叙事文本主体内容。...
    packageimg
  • NARRATIVAS_DE_ENTERRO_墓葬叙事转录文档数据

    2026年1月28日 30 103 96

    数据集概述 本数据集包含一份转录的墓葬叙事文档,聚焦于墓葬相关的叙事内容转录,为文化研究领域提供结构化的文本资料,可用于分析墓葬叙事的文化内涵与表达形式。 文件详解 文件名称:NARRATIVAS DE ENTERRO (1) (1).docx 文件格式:DOCX...
    packageimg
  • REVERINO_Based_中世纪教宗文献摘要与全文配对数据_训练基准

    2026年1月22日 30 145 134

    数据集概述 本数据集包含四千五百三十三对拉丁regesta(摘要)与对应的中世纪教宗文献全文,源自MGH和Auvray两个历史文献集,覆盖1216至1268年教宗文献。数据支持拉丁文本摘要研究与大语言模型自动摘要工具开发,可作为大语言模型处理中世纪拉丁文本的性能评估基准。 文件详解 数据文件(共9个)...
    packageimg
  • IN02036_Siddham_达兰普尔石刻铭文2号梵语XML数据_草稿版

    2026年1月21日 30 56 45

    数据集概述 本数据集为IN02036达兰普尔石刻铭文2号的梵语XML文件,属于Epidoc格式草稿版,不含元数据,计划纳入“Siddham”档案。数据集仅包含一个文件,无目录层级,无训练/测试、数据/标签、原始/处理等拆分,文件类型单一为XML格式。 文件详解 文件名称:IN02036.xml 文件格式:XML...
    packageimg
  • IN02018_Based_Siddham档案待整合梵语铭文XML草稿数据

    2026年1月21日 30 196 167

    数据集概述 本数据集包含IN02018 Chowkitar铭文的梵语XML文件,为Epidoc格式草稿版,无元数据,计划整合至“Siddham”档案。数据集仅含一个文件,无目录层级划分,文件类型单一为XML格式。 文件详解 文件名称:IN02018.xml 文件格式:XML...
    packageimg
  • IN02001_Based_昌古纳拉扬石柱东轴梵语铭文XML数据_Draft

    2026年1月20日 30 8 0

    数据集概述 本数据集包含IN02001昌古纳拉扬石柱东轴铭文的梵语文本,以XML格式存储,为Epidoc标准的草稿版本,计划纳入Siddham档案。数据无元数据,仅包含一份核心文件,用于铭文的数字化保存与研究。 文件详解 核心文件 文件名称:IN02001.xml 文件格式:XML...
    packageimg
  • IN01010_Sanskrit_Pīparḍūlā特许状梵语文本XML数据

    2026年1月20日 30 136 100

    数据集概述 本数据集包含IN01010号Pīparḍūlā特许状(Narendra颁布)的梵语文本XML文件,无元数据,仅含一份核心文件。数据聚焦于古梵语特许状的数字化文本内容,为梵语文献研究提供结构化的文本资源。 文件详解 文件名称:IN01010.xml 文件格式:XML...
    packageimg
  • IN01047_Tadagani_Inscription_Madhuvarman时期梵语铭文数据

    2026年1月11日 30 75 59

    数据集概述 本数据集包含IN01047号Tadagani铭文的梵语文本XML文件,记录Madhuvarman时期的铭文内容,无元数据信息。数据集仅含一个文件,用于历史铭文研究与梵语文本分析。 文件详解 文件名称:IN01047.xml 文件格式:XML...
    packageimg
  • IN01029_Based古印度Māndhātṛvarman授权令梵语XML数据

    2026年1月15日 30 187 111

    数据集概述 本数据集包含古印度铭文IN01029(Kūḍgere Grant of Māndhātṛvarman,Year 2)的梵语文本XML文件,无元数据。数据集仅含一个文件,无目录结构,未划分训练/测试集、数据/标签集或原始/处理集,文件类型为XML格式。 文件详解 文件名称:IN01029.xml 文件格式:XML...
    packageimg
  • AmadissigloXX_Based_现代骑士文学与堂吉诃德重写数据库_v1_1

    2026年1月14日 30 90 75

    数据集概述 本数据集是AmadissigloXX项目下的现代骑士文学与《堂吉诃德》重写数据库,包含Antonio Ledesma Hernández于1903年创作的《Canuto Espárrago》相关数据。数据集提供JSON格式的作品元数据与XML格式的完整数据库,支持对该作品的文学研究与文本分析。 文件详解 JSON文件:...
    packageimg
  • IN02064_Epidoc_Based_Yengahiti石刻铭文梵语XML草稿数据

    2026年1月14日 30 208 142

    数据集概述 本数据集为IN02064 Yengahiti石刻铭文的梵语文本XML文件,属于Epidoc格式草稿版本,无元数据,计划纳入"Siddham"档案。数据集仅包含一个文件,用于古文字学领域对石刻铭文的数字化研究与分析。 文件详解 文件名称:IN02064.xml 文件格式:XML...
    packageimg
  • DHARMA_Based_Veṅgī_Cālukya铜板特许状劝诫诗节数据集_2025

    2026年1月14日 30 30 23

    数据集概述 本数据集聚焦Veṅgī Cālukya王朝铜板土地授予特许状中的劝诫诗节使用情况,由DHARMA项目研究人员Dániel Balogh于2024年编译,2025年8月完成归档。数据基于该王朝铜板铭文的数字版本及相关项目参考资料,为研究古代印度特许状文本结构与文化内涵提供结构化资料。 文件详解 文件名称:Vengi Calukya...
    packageimg
  • IN01055_Halsi_Grant_of_Ravivarman_梵语铭文XML数据

    2026年1月14日 30 119 0

    数据集概述 本数据集为IN01055编号的《拉维瓦尔曼的哈尔西授予文书》(含5块碑板)的梵语文本XML文件,未包含元数据。数据集仅含一个文件,无目录层级划分,文件类型单一为XML格式,无训练测试、数据标签或原始/处理数据的拆分。 文件详解 文件名称:IN01055.xml 文件格式:XML...
    packageimg
  • IN01060_Source_Ravivarman_Sirsi_Grant梵语XML数据

    2026年1月13日 30 126 84

    数据集概述 本数据集为IN01060号拉维瓦尔曼的锡尔西敕令(Sirsi Grant of Ravivarman)的梵语XML文件,不含元数据。数据集仅包含一个文件,无目录层级划分,文件类型单一为XML格式。 文件详解 文件名称:IN01060.xml 文件格式:XML...
    packageimg
  • IN02058_Siddham_加德满都Bhairavadhoka碑铭梵语XML草稿数据

    2026年1月13日 30 205 129

    数据集概述 本数据集为加德满都Bhairavadhoka碑铭(编号IN02058)的梵语XML文件,是Epidoc格式的草稿版本,计划纳入Siddham档案。数据无元数据,仅包含一份XML文件,用于碑铭文献的数字化整理与研究。 文件详解 文件名称:IN02058.xml 文件格式:XML...
    packageimg
  • IN02043_Draft_Epidoc_Amsuvarma桑加铭文梵语XML数据_待归档

    2026年1月13日 30 180 95

    数据集概述 本数据集为IN02043编号的Amsuvarma桑加铭文梵语文本,以XML格式存储的Epidoc标准草稿版本,不含元数据,计划纳入“Siddham”档案。数据集仅包含一个文件,用于铭文文献的数字化与存档。 文件详解 文件名称:IN02043.xml 文件格式:XML...
    packageimg
  • IN01052_梵语基础哈尔西语研究项目_Kakutsthavarman资助_梵语XML数据

    2026年1月12日 30 151 106

    数据集概述 本数据集为IN01052编号的Kākutsthavarman的Halsi Grant梵语铭文的XML文件,无元数据。包含1个文件,无目录层级,文件类型单一为XML格式,未划分训练/测试、数据/标签或原始/处理数据集。 文件详解 文件名称:IN01052.xml 文件格式:XML 字段映射介绍:文件为Kākutsthavarman的Halsi...
    packageimg