找到2个数据集

格式: ZIP 标签: 历史语料

过滤结果
  • Heliand_Parsed_Based_古撒克逊语Heliand文本解析完整数据

    2025年12月7日 30 18 1

    数据集概述 该数据集包含古撒克逊语福音书《Heliand》C手稿的五千九百六十八行内容,采用Sievers(一八七八年)版本,相比Behaghel标准版更适合语言学研究。数据集以UTF-8纯文本格式设计,遵循Penn历史英语语料库格式,支持CorpusSearch...
    packageimg
  • 希腊议会二战后会议记录分析与识别数据集1946_1947

    2025年12月5日 30 43 32

    数据集概述 该数据集通过文本识别与自然语言处理技术,解锁1946-1947年希腊议会会议记录的历史语料。包含经Transkribus训练的文本识别模型处理的3156张扫描图像,以及通过语言模型优化、信息提取技术分析的演讲数据,首次量化了获得掌声的议题。 文件详解 文件名称: README.md,文件格式: Markdown,内容:...
    packageimg