-
哥廷根印度语言电子文本注册_婆罗门文献数据集
2025年12月22日 30 64 53
数据集概述 该数据集是哥廷根印度语言电子文本注册(GRETIL)的一部分,聚焦于印度语言中的婆罗门(BRĀHMAṆA)文献,包含十八个HTML格式的文本文件,为研究印度古典文献提供基础资料。 文件详解...
-
哥廷根印度语言电子文本注册库_佛教文献
2025年12月20日 30 10 8
数据集概述 该数据集为哥廷根印度语言电子文本注册库(GRETIL)中的佛教文献部分,包含一百零一个HTML格式文件,无目录层级,未划分训练/测试集、数据/标签或原始/处理数据。 文件详解 该数据集由一百零一个文件组成,具体说明如下: - 文件类型: - 所有文件均为HTML格式(.htm),占比百分之百 - 文件命名示例:...
-
哥廷根印度语言电子文本登记帕里西塔数据集
2025年12月19日 30 72 8
数据集概述 该数据集是哥廷根印度语言电子文本登记(GRETIL)的帕里西塔(PARIŚIṢTA)部分,包含3个HTML格式的印度语言电子文本文件,无目录结构,文件类型单一。 文件详解 核心文本文件(共3个,均为.htm格式): dantyovu.htm:HTML格式的印度语言电子文本文件 avpari_u.htm:HTML格式的印度语言电子文本文件...
-
哥廷根印度语言电子文本注册处词典学数据集
2025年12月6日 30 85 63
数据集概述 该数据集是哥廷根印度语言电子文本注册处(GRETIL)下的词典学相关数据,主要包含四个HTML格式的文件,未区分训练/测试集、数据/标签集或原始/处理数据,文件类型单一。 文件详解 数据集包含4个HTML格式文件,具体如下: 文件名称:amark2_u.htm、amark3_u.htm、amark1pu.htm、amark1hu.htm...



