-
GRS_Based_中世纪斯拉夫国王编年史命名人物分类数据
2026年1月30日 30 38 37
数据集概述 本数据集为《Gesta regum Sclavorum》(中世纪拉丁编年史,记录亚得里亚海东岸及邻近地区斯拉夫国王谱系与历史)中的所有命名人物列表,包含一个Excel文件,分两个工作表分别列出男性和女性命名人物,呈现文本中人物命名的性别分布差异。 文件详解 文件名称:Named Male and Female Characters in...
-
IN01061_Sanskrit_XML_Talagunda碑铭数据
2026年1月27日 30 120 116
数据集概述 本数据集包含IN01061编号的Talagunda碑铭数据,该碑铭属于Queen Prabhavati时期、Mrgesavarman统治时代,以梵语XML格式呈现,不含元数据。数据集仅包含一个文件,用于历史铭文文本的数字化存储与分析。 文件详解 文件名称:IN01061.xml 文件格式:XML...
-
IN01015_Sanskrit_Dhamatari特许状文本XML数据
2026年1月21日 30 83 5
数据集概述 本数据集为Sudevaraja的Dhamatari特许状的梵语文本数字化文件,以XML格式存储,未包含元数据。数据集仅含一个文件,无目录层级结构,无训练/测试、数据/标签或原始/处理数据的划分,文件类型单一为XML。 文件详解 文件名称:IN01015.xml 文件格式:XML...
-
IN01012_Sanskrit_XML格式Jayaraja_Arang宪章文本数据
2026年1月18日 30 187 125
数据集概述 本数据集包含IN01012编号对应的Jayaraja Arang宪章的梵语文本,以XML格式存储,无元数据。数据集仅含一个文件,无目录层级结构,未划分训练/测试、数据/标签或原始/处理数据,是研究古代梵语历史文献的基础文本资源。 文件详解 文件名称:IN01012.xml 文件格式:XML...
-
曼布里诺数字图书馆_意大利骑士文学_第13卷第4册_希腊的斯费拉蒙迪_数字化版本数据
2026年1月18日 30 123 3
数据集概述 本数据集是意大利骑士文学作品《13/4 Sferamundi di Grecia. Quarta parte》的数字化学术版本,包含转录与评注XML-TEI文件、多格式电子书及计算分析用纯文本文件,属于Mambrino数字图书馆项目,用于支持文学研究与数字化分析。 文件详解 转录与评注文件...
-
曼布里诺数字图书馆_意大利骑士文学第13卷第1章_希腊的斯费拉蒙迪_数字学术版数据集
2026年1月18日 30 19 17
数据集概述 本数据集为意大利骑士文学作品《13/1 Sferamundi di Grecia. Prima parte》的数字学术版本,包含转录与评注XML-TEI文件、多格式电子书及计算分析用纯文本文件,是Mambrino数字图书馆项目成果,用于支持骑士文学的数字化研究与文本分析。 文件详解 转录与评注文件...
-
曼布里诺数字图书馆_意大利骑士文学第13卷第3章_希腊的斯费拉蒙迪_第三部分数字化版本数据
2026年1月12日 30 195 5
数据集概述 本数据集为意大利骑士文学作品《13/3 Sferamundi di Grecia. Terza parte》的数字化学术版本,包含转录与评注的XML-TEI文件、多格式电子书及用于计算分析的纯文本文件,是Mambrino数字图书馆项目的一部分,支持意大利骑士文学的数字化研究。 文件详解 转录与评注文件...
-
曼布里诺数字图书馆_意大利骑士文学_第13卷第6册_斯费拉蒙迪的希腊_第六部分数字化版本数据
2026年1月12日 30 66 23
数据集概述 本数据集为意大利骑士文学作品《13/6 Sferamundi di Grecia. Sesta parte》的数字化学术版本,包含转录与评注XML-TEI文件、多格式电子书及计算分析用纯文本文件,是Mambrino数字图书馆项目的一部分,用于支持骑士文学的数字化研究。 文件详解 转录与评注文件...
-
数据18世纪法国小说数据集1751_1800
2025年12月14日 30 44 10
数据集概述 该数据集包含1751至1800年间创作或首次出版的200部18世纪法国小说的数字化文本,以TEI/XML格式存储,同时提供精简版和扩展版TSV元数据文件,为法国文学研究提供结构化的文本资源。 文件详解 核心文件: roman18-novels_and_scripts.zip:压缩文件,包含所有TEI/XML格式的小说文本及相关脚本...
-
哥廷根印度语言电子文本注册库_印度尼西亚语文本
2025年12月12日 30 50 4
数据集概述 本数据集是哥廷根印度语言电子文本注册库(GRETIL)中收录的印度尼西亚语文本集合,包含两篇HTML格式的文本摘录文件,为研究印度尼西亚语文献提供基础数据支持。 文件详解 文件名称: sktexcerptsjb_pu.htm:HTML格式文件,为印度尼西亚语文本摘录。 文件名称:...
-
爱沙尼亚历史报纸众包OCR校正数据集
2025年12月11日 30 104 36
数据集概述 该数据集包含爱沙尼亚国家图书馆DIGAR档案中的历史报纸文章及其对应的众包OCR校正内容,涵盖校正数据、统计图表及说明文档,为研究历史报纸文本数字化处理提供支持。 文件详解 文件名称: README.md,文件格式: Markdown,内容说明: 数据集说明文档,包含数据来源、预处理方法(如原始文本逆向工程、过滤规则)等核心信息。...
-
IN02025_Kisipidi石碑482号译文数据集
2025年12月9日 30 133 67
数据集概述 本数据集包含IN02025 Kisipidi石碑482号的译文资料,以文档形式呈现,涵盖PDF和DOCX两种格式,为石碑铭文的文本解读与研究提供直接数据支持。 文件详解 文件名称:IN02025 XXXIX, XL, XLI, XLII, XLIII.pdf 文件格式:PDF 内容说明:包含IN02025...
-
IN02065坎德斯瓦拉柱铭文翻译数据集
2025年12月7日 30 179 54
数据集概述 该数据集包含IN02065坎德斯瓦拉柱铭文的翻译文本,通过文档文件呈现铭文内容,为研究古代铭文的文字记录、历史信息及文化背景提供基础资料,支持相关领域的文本分析与学术研究。 文件详解 文件名称:IN02065 CIV Caṇḍeśvara Pillar Inscription.docx 文件格式:DOCX...



