马丁_路德语域现象研究语料库0_1

数据集概述

该数据集为马丁·路德语域现象研究语料库(RegiL v0.1),含7个子语料库、72篇文档及179,996个文本标记,基于人工归一化进行词性和词形标注,转换为ANNIS格式,旨在通过文本类型/体裁近似不同语域,支撑路德作品中语域模式的研究。

文件详解

  • 文件名称: Documentation RegiL v01.pdf
  • 文件格式: PDF (.pdf)
  • 内容说明: 描述RegiL语料库v0.1的设计、架构和语料库构建流程的文档
  • 文件名称: RegiL 0.1.zip
  • 文件格式: ZIP压缩包 (.zip)
  • 内容说明: 包含语料库核心数据,可能涵盖标注文本层(text、norm、pos、lemma)及ANNIS格式的语料库文件

数据来源

德国研究基金会(DFG)资助的CRC1412语域项目B04(项目编号416591334)

适用场景

  • 语域语言学研究: 分析马丁·路德作品中不同语域模式的出现与迁移
  • 历史语言学研究: 探究路德文本中个体内语言变异的情境功能参数
  • 计算语言学应用: 基于标注语料库开展词性、词形还原等自然语言处理任务
  • 文献学分析: 研究宗教改革时期文本类型与体裁对语域表达的影响
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 47.4 MiB
最后更新 2025年12月21日
创建于 2025年12月21日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。