-
伦敦生活请愿项目数据集2_0
数据集概述 本数据集是伦敦生活请愿项目的2.0版本更新,新增了基于伦敦生活姓名标记的可识别请愿人数据,并优化了教区教堂执事请愿书的标签,为研究历史请愿活动提供更丰富的信息。 文件详解 文件名称: sharonhoward/llpp-v2.0.zip 文件格式: ZIP压缩包 内容说明:...
-
BNE_Based_PastReader_2025_历史报刊数字化完整数据
数据集概述 该数据集用于IberLEF 2025的PastReader 2025共享任务,基于西班牙国家图书馆数字化的公共领域历史报刊生成,包含训练、开发、测试三类压缩文件,支持相关历史文本处理任务研究。 文件详解 文件名称:train.zip 文件格式:ZIP压缩文件 说明:训练集压缩包,具体内容未提供预览 文件名称:dev.zip...
-
德国Halle_Hirsch药房历史档案数据集1924_1948
数据集概述 该数据集收录了德国Halle Hirsch药房的历史档案,包含1924-1948年的历史问卷、索引卡片及部分可公开的附属材料,通过Kalliope门户网站进行编目,为研究该药房历史提供一手资料。 文件详解 文件名称: 18777.pdf:PDF格式文档文件,可能包含历史问卷或相关文本资料 文件名称:...
-
TEI_XML格式苏黎世州公报数据集1954_2001
数据集概述 本数据集是苏黎世州中央系列文献(19-20世纪)第四系列的数字化成果,包含1954-2001年苏黎世州公报的TEI-XML格式全文数据。州公报是苏黎世州官方信息发布载体,聚焦政治决策与立法相关的文本部分,为研究该时期地方治理、立法进程提供结构化历史数据。 文件详解 文件名称:ABl_XML_NER_1954-2001.zip...
-
帕坦地区巴希利托勒碑铭翻译数据集
数据集概述 该数据集包含尼泊尔帕坦地区巴希利托勒碑铭(IN02053)的翻译文件,涵盖PDF与DOCX两种格式的文档,为研究该碑铭的文字内容及历史背景提供直接资料。 文件详解 文件名称:IN02053 XCIII Inscription of Bhogyananhitol (Patan).pdf 文件格式:PDF...
-
TranscriboQuest古希腊团队数据集2024
数据集概述 本数据集是2024年九月十一日至十三日在里昂举办的TranscriboQuest活动期间,由古希腊团队生成的数据集,包含活动相关的文档、配置文件和数据压缩包,具体信息可参考README文件。 文件详解 README.md: MD格式文件,包含项目介绍、团队信息、数据描述、指南和致谢等内容 Guidelines.pdf:...
-
巴布纳玛_测量单位翻译对比分析数据集
数据集概述 本数据集聚焦于《巴布纳玛》中测量单位翻译的对比分析,包含相关研究的PDF文档,为理解该文本中测量单位翻译的差异与特点提供资料支持。 文件详解 文件名称: Sayyora Shodmonova.pdf 文件格式: PDF 文件内容: 该文档为《巴布纳玛》测量单位翻译对比分析的研究文件,具体内容需查看文档详情 适用场景 翻译学研究:...
-
哈尔伯施塔特约翰内斯药房历史档案数据集1924_1947
数据集概述 该数据集包含德国哈尔伯施塔特约翰内斯药房的历史档案,主要为1924至1948年的历史问卷、索引卡片及部分精选附件,通过Kalliope门户网站编目,记录了药房历史相关信息。 文件详解 该数据集包含2个文件,具体说明如下: - 文件名称: 73005.pdf - 文件格式: PDF (.pdf) - 文件内容:...
-
巴西葡萄牙语文学语料库
巴西葡萄牙语文学语料库 数据来源:互联网公开数据 标签:文学,葡萄牙语,巴西,文学主题,风格分析,作者识别,历史文本,自然语言处理 数据概述 本数据集收录了1840年至1908年间巴西葡萄牙语文学作品的语料,总字数超过370万字。数据集包含81部独立的文学作品,由多位知名巴西作家创作,包括阿道夫·坎尼亚(Adolfo...
-
郁金香狂热荷兰报纸档案数据集
郁金香狂热荷兰报纸档案数据集 数据来源:互联网公开数据 标签:郁金香狂热,荷兰报纸,历史文本,NLP,市场预测,时间序列分析,经济历史 数据概述:...
-
巴西葡萄牙语文学语料库数据集
巴西葡萄牙语文学语料库数据集 数据来源:互联网公开数据 标签:巴西文学,葡萄牙语,文学语料库,文本分析,主题识别,作者归属,历史文本,文化研究 数据概述 本数据集收录了1840年至1908年间巴西文学作品,内容涵盖超过370万字的葡萄牙语文本,涉及81部独立作品。这些作品由多位知名巴西作家创作,包括阿道福·坎尼亚(Adolfo...
-
美国国情咨文政治演讲文本数据集1790-2019
美国国情咨文政治演讲文本数据集1790-2019 数据来源:互联网公开数据 标签:国情咨文,总统演讲,政治分析,历史文本,语言演变,政策研究,文本挖掘 数据概述:...



