找到14个数据集

标签: 结构化文本

过滤结果
  • Pyu_Based骠铭文语料库XML数据20180326

    2026年1月30日 30 30 4

    数据集概述 本数据集为骠铭文语料库的XML压缩文件,包含由Arlo Griffiths、Marc Miyake和Julian K. Wheatley完成的骠铭文转写内容,语料库通过指定网址持续更新。每个XML文件对应一份骠铭文,转写中用C表示未知辅音、V表示未知元音,为骠铭文研究提供结构化文本资源。 文件详解 文件名称:Corpus of Pyu...
    packageimg
  • IN01049_Based_拉维瓦尔曼Kavadi残碑梵语铭文XML数据

    2026年1月22日 30 27 0

    数据集概述 本数据集包含IN01049号拉维瓦尔曼Kavadi残碑铭文的梵语文本数据,以XML格式存储,不含元数据。数据核心为该残碑铭文的文本内容,是研究古代铭文及相关历史文化的基础资料,仅包含一个文件。 文件详解 文件名称:IN01049.xml 文件格式:XML...
    packageimg
  • ENHG_Annotation_Based_中世纪采矿文献TEI标注数据集

    2026年1月21日 30 79 57

    数据集概述 本数据集包含历史采矿文献《Verleihbuch der Rattenberger Bergrichter》(TLA Hs....
    packageimg
  • IN02068_EpiDoc_Bhrngaresvara寺庙铭文梵语XML草稿数据

    2026年1月15日 30 61 28

    数据集概述 本数据集包含IN02068编号的Bhrngaresvara寺庙铭文的梵语XML文件,为EpiDoc格式的草稿版本,计划纳入"Siddham"档案。数据无元数据,仅包含一份核心文件,用于历史铭文的数字化存储与文本分析。 文件详解 文件名称:IN02068.xml 文件格式:XML...
    packageimg
  • IN02058_Siddham_加德满都Bhairavadhoka碑铭梵语XML草稿数据

    2026年1月13日 30 192 172

    数据集概述 本数据集为加德满都Bhairavadhoka碑铭(编号IN02058)的梵语XML文件,是Epidoc格式的草稿版本,计划纳入Siddham档案。数据无元数据,仅包含一份XML文件,用于碑铭文献的数字化整理与研究。 文件详解 文件名称:IN02058.xml 文件格式:XML...
    packageimg
  • musiXplora_Based_Paul_de_Wit_w1901_音乐家个人档案数据

    2026年1月13日 30 67 65

    数据集概述 本数据集为音乐家Paul de Wit(musiXplora-ID:w1901)的个人档案数据,包含其基本信息、教育背景、工作环境、社交网络、著作媒体、交易记录、传承关系、相关机构及文献等内容,全面记录了该音乐家的职业经历与社会关联,是研究19世纪末至20世纪初欧洲音乐史的重要资料。 文件详解 核心档案文件: 文件名称:Paul de...
    packageimg
  • Scarlet_Gown_Robert_Murray_第二版初步说明TEI编码数据2022

    2026年1月12日 30 202 108

    数据集概述 本数据集为Robert Fuller Murray所著《The Scarlet Gown》第二版初步说明的XML-TEI标准编码文件,由帕多瓦大学2022年春季Digital Philology课程产出,关联DissGea、MoHu Center、MobiLab机构。数据集含1个文件,无目录层级,用于数字文献学领域的文本编码研究与应用。...
    packageimg
  • k0391_musiXplora_Based_Georg_Kinsky音乐学者全维度档案数据

    2026年1月12日 30 190 61

    数据集概述 本数据集是musiXplora平台收录的音乐学者Georg Kinsky(ID:k0391)的全维度个人档案,涵盖其基本信息、职业身份、教育背景、工作环境、社交网络、著作成果、项目参与及研究领域等内容,为研究该学者的学术生涯与音乐学贡献提供结构化参考。 文件详解 核心档案文件 文件名称:未明确单文件名称(以结构化描述呈现)...
    packageimg
  • b1316_musiXplora_基于约翰_塞巴斯蒂安_巴赫的数据集_b1316_生平与关系完整数据

    2026年1月5日 30 84 83

    数据集概述 本数据集为musiXplora平台中ID为b1316的Johann Sebastian Bach个人文档数据,包含其基本信息、家庭关系、教育背景、职业经历、社交网络、作品关联等内容,全面记录了这位音乐家的生平与社会关系网络,为音乐历史研究提供结构化参考。 文件详解 核心信息文件 文件名称:Johann Sebastian Bach...
    packageimg
  • KBNLB410017188_KB_Based_Over_Yssel土地权利文献转录数据_纠缠的历史项目

    2025年12月31日 30 71 50

    数据集概述 本数据集是1634年出版的荷兰Overijssel省土地权利文献《Landtrechten van Over-Yssel》的转录数据,源自荷兰国家图书馆(KB)馆藏副本。通过Transkribus和Abbyy FineReader工具处理,遵循特定转录规范,为研究荷兰早期现代土地法提供结构化文本资源。 文件详解...
    packageimg
  • 洪堡数字版第十一版11_0_1版TEI_XML数据集

    2025年12月8日 30 90 41

    数据集概述 该数据集是2025年6月4日发布的洪堡数字版第十一版11.0.1版的TEI-XML格式数据,包含日记、信件、文献、研究论文、年表条目、索引等编辑文本及副文本,对HTML版本进行了技术错误修正。 文件详解 文件名称: edition_humboldt_digital_v11.zip 文件格式: ZIP压缩包 内容说明:...
    packageimg
  • LoGov意大利访谈记录第2号

    2025年12月7日 30 209 202

    数据集概述 本数据集为LoGov项目框架下的意大利访谈记录,聚焦公共行政、公法和政治学领域专家观点,旨在丰富意大利国家报告的研究范围,包含一份结构化访谈文本资料。 文件详解 文件名称:LoGov_Italy_TRN_02.pdf 文件格式:PDF...
    packageimg
  • 学术论文写作文本结构分析数据集

    2025年9月22日 30 35 4

    学术论文写作文本结构分析数据集_Academic_Paper_Writing_Text_Structure_Analysis 数据来源:互联网公开数据 标签:文本分析, 自然语言处理, 论文写作, 结构化文本, 文本标注, 机器学习, 实体识别, 文本分割 数据概述:...
    packageimg
  • 学术论文写作结构识别数据集

    2025年7月27日 30 18 8

    学术论文写作结构识别数据集_Academic_Paper_Writing_Structure_Identification 数据来源:互联网公开数据 标签:文本分析, 自然语言处理, 论文结构, 文本标注, 机器学习, 深度学习, 语料库, 结构化文本 数据概述:...
    packageimg