早期英语书信扩展样本库第二部分数据集2022

数据集概述

该数据集是早期英语书信语料库(CEEC-400)18世纪部分的第二个公开版本,属于早期英语书信扩展样本库(CEECES)的一部分,包含书信元数据及相关说明文档,为研究18世纪英语书信语言特征提供数据支持。

文件详解

  • Key to metadata codes in CEECES.pdf:PDF格式,提供CEECES元数据编码的说明文档
  • CEECES2-metadata.xlsx:Excel格式,包含书信元数据,字段示例有LetterID(书信ID)、Collection Period(收集时期)、SenderID(发信人ID)、SenderFirstName(发信人名字)、SenderLastName(发信人姓氏)、SenderGender(发信人性别)、SenderRegion(发信人地区)等
  • CEECES2-metadata.txt:TXT格式,内容与CEECES2-metadata.xlsx一致,为纯文本版元数据
  • CEECES 2 manual.pdf:PDF格式,CEECES 2的使用手册
  • CEECES-2.zip:压缩包格式,可能包含数据集的其他相关文件

数据来源

赫尔辛基大学语言系

适用场景

  • 历史语言学研究:分析18世纪英语书信的语言结构与演变特征
  • 社会语言学研究:探究18世纪不同社会群体书信的语言差异
  • 语料库语言学研究:构建早期英语书信语料库的对比分析基础
  • 数字人文研究:支持18世纪社会文化语境下的书信文本挖掘
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 5.46 MiB
最后更新 2025年12月19日
创建于 2025年12月19日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。