哥廷根印度语言电子文本注册库_摩诃婆罗多节选

数据集概述

该数据集是哥廷根印度语言电子文本注册库(GRETIL)收录的《摩诃婆罗多》节选内容,包含十七个HTML格式文件,未进行训练测试、数据标签或原始/处理数据的拆分,所有文件均为网页格式,无额外说明文档或内容预览。

文件详解

  • 核心文件:共十七个HTML格式文件,文件名称示例包括bhg4c16u.htm、narayriu.htm、bhgce__u.htm、hv_coniu.htm、bhg4c17u.htm、hv_cumiu.htm、hv_appau.htm、hv_appiu.htm等
  • 文件格式:所有文件均为.htm格式(占百分之百)
  • 数据结构:无明确训练测试、数据标签或原始/处理数据的拆分结构

数据来源

哥廷根印度语言电子文本注册库(GRETIL)

适用场景

  • 印度古典文学研究:用于《摩诃婆罗多》文本内容的数字化分析与文献整理
  • 梵语语言学研究:可作为梵语电子文本语料,支持语言特征提取与语法分析
  • 数字人文研究:适用于古典文献数字化保存与传播的案例研究
  • 比较文学分析:为跨文化文学作品对比提供原始文本数据支持
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 15.81 MiB
最后更新 2025年12月14日
创建于 2025年12月14日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。