-
Pyu_Based骠铭文语料库XML数据20180326
2026年1月30日 30 30 4
数据集概述 本数据集为骠铭文语料库的XML压缩文件,包含由Arlo Griffiths、Marc Miyake和Julian K. Wheatley完成的骠铭文转写内容,语料库通过指定网址持续更新。每个XML文件对应一份骠铭文,转写中用C表示未知辅音、V表示未知元音,为骠铭文研究提供结构化文本资源。 文件详解 文件名称:Corpus of Pyu...
-
IN01049_Based_拉维瓦尔曼Kavadi残碑梵语铭文XML数据
2026年1月22日 30 27 0
数据集概述 本数据集包含IN01049号拉维瓦尔曼Kavadi残碑铭文的梵语文本数据,以XML格式存储,不含元数据。数据核心为该残碑铭文的文本内容,是研究古代铭文及相关历史文化的基础资料,仅包含一个文件。 文件详解 文件名称:IN01049.xml 文件格式:XML...
-
ENHG_Annotation_Based_中世纪采矿文献TEI标注数据集
2026年1月21日 30 79 57
数据集概述 本数据集包含历史采矿文献《Verleihbuch der Rattenberger Bergrichter》(TLA Hs....
-
IN02068_EpiDoc_Bhrngaresvara寺庙铭文梵语XML草稿数据
2026年1月15日 30 61 28
数据集概述 本数据集包含IN02068编号的Bhrngaresvara寺庙铭文的梵语XML文件,为EpiDoc格式的草稿版本,计划纳入"Siddham"档案。数据无元数据,仅包含一份核心文件,用于历史铭文的数字化存储与文本分析。 文件详解 文件名称:IN02068.xml 文件格式:XML...
-
IN02058_Siddham_加德满都Bhairavadhoka碑铭梵语XML草稿数据
2026年1月13日 30 192 172
数据集概述 本数据集为加德满都Bhairavadhoka碑铭(编号IN02058)的梵语XML文件,是Epidoc格式的草稿版本,计划纳入Siddham档案。数据无元数据,仅包含一份XML文件,用于碑铭文献的数字化整理与研究。 文件详解 文件名称:IN02058.xml 文件格式:XML...
-
musiXplora_Based_Paul_de_Wit_w1901_音乐家个人档案数据
2026年1月13日 30 67 65
数据集概述 本数据集为音乐家Paul de Wit(musiXplora-ID:w1901)的个人档案数据,包含其基本信息、教育背景、工作环境、社交网络、著作媒体、交易记录、传承关系、相关机构及文献等内容,全面记录了该音乐家的职业经历与社会关联,是研究19世纪末至20世纪初欧洲音乐史的重要资料。 文件详解 核心档案文件: 文件名称:Paul de...
-
Scarlet_Gown_Robert_Murray_第二版初步说明TEI编码数据2022
2026年1月12日 30 202 108
数据集概述 本数据集为Robert Fuller Murray所著《The Scarlet Gown》第二版初步说明的XML-TEI标准编码文件,由帕多瓦大学2022年春季Digital Philology课程产出,关联DissGea、MoHu Center、MobiLab机构。数据集含1个文件,无目录层级,用于数字文献学领域的文本编码研究与应用。...
-
k0391_musiXplora_Based_Georg_Kinsky音乐学者全维度档案数据
2026年1月12日 30 190 61
数据集概述 本数据集是musiXplora平台收录的音乐学者Georg Kinsky(ID:k0391)的全维度个人档案,涵盖其基本信息、职业身份、教育背景、工作环境、社交网络、著作成果、项目参与及研究领域等内容,为研究该学者的学术生涯与音乐学贡献提供结构化参考。 文件详解 核心档案文件 文件名称:未明确单文件名称(以结构化描述呈现)...
-
b1316_musiXplora_基于约翰_塞巴斯蒂安_巴赫的数据集_b1316_生平与关系完整数据
2026年1月5日 30 84 83
数据集概述 本数据集为musiXplora平台中ID为b1316的Johann Sebastian Bach个人文档数据,包含其基本信息、家庭关系、教育背景、职业经历、社交网络、作品关联等内容,全面记录了这位音乐家的生平与社会关系网络,为音乐历史研究提供结构化参考。 文件详解 核心信息文件 文件名称:Johann Sebastian Bach...
-
KBNLB410017188_KB_Based_Over_Yssel土地权利文献转录数据_纠缠的历史项目
2025年12月31日 30 71 50
数据集概述 本数据集是1634年出版的荷兰Overijssel省土地权利文献《Landtrechten van Over-Yssel》的转录数据,源自荷兰国家图书馆(KB)馆藏副本。通过Transkribus和Abbyy FineReader工具处理,遵循特定转录规范,为研究荷兰早期现代土地法提供结构化文本资源。 文件详解...
-
洪堡数字版第十一版11_0_1版TEI_XML数据集
2025年12月8日 30 90 41
数据集概述 该数据集是2025年6月4日发布的洪堡数字版第十一版11.0.1版的TEI-XML格式数据,包含日记、信件、文献、研究论文、年表条目、索引等编辑文本及副文本,对HTML版本进行了技术错误修正。 文件详解 文件名称: edition_humboldt_digital_v11.zip 文件格式: ZIP压缩包 内容说明:...
-
LoGov意大利访谈记录第2号
2025年12月7日 30 209 202
数据集概述 本数据集为LoGov项目框架下的意大利访谈记录,聚焦公共行政、公法和政治学领域专家观点,旨在丰富意大利国家报告的研究范围,包含一份结构化访谈文本资料。 文件详解 文件名称:LoGov_Italy_TRN_02.pdf 文件格式:PDF...
-
学术论文写作文本结构分析数据集
2025年9月22日 30 35 4
学术论文写作文本结构分析数据集_Academic_Paper_Writing_Text_Structure_Analysis 数据来源:互联网公开数据 标签:文本分析, 自然语言处理, 论文写作, 结构化文本, 文本标注, 机器学习, 实体识别, 文本分割 数据概述:...
-
学术论文写作结构识别数据集
2025年7月27日 30 18 8
学术论文写作结构识别数据集_Academic_Paper_Writing_Structure_Identification 数据来源:互联网公开数据 标签:文本分析, 自然语言处理, 论文结构, 文本标注, 机器学习, 深度学习, 语料库, 结构化文本 数据概述:...



