数据集概述
本数据集包含BMSatire Descriptions语料库的分析数据及相关文档,属于英国学术院资助项目“Curatorial Voice: legacy descriptions of art objects and their contemporary uses”的成果。语料库源自M. Dorothy George于1935-1954年发表的《大英博物馆版画与素描部藏政治及人物讽刺作品目录》第5至11卷,经大英博物馆ResearchSpace平台以开放链接数据形式发布,共含7个文件。
文件详解
- 文本数据文件(.txt格式,共5个)
- keyness.txt:包含"Investigating Curatorial Voice with Corpus Linguistic Techniques"一文引用的文档与数据,记录关键词分析相关内容
- ly_words.txt:未明确具体内容,推测为特定词汇列表类数据
- concordances.txt:未明确具体内容,推测为语料库索引类数据
- frequencyList.txt:未明确具体内容,推测为词频统计列表类数据
- BNC_wordlist.txt:未明确具体内容,推测为英国国家语料库相关词汇列表
- 压缩文件(.zip格式,共1个)
- CurV-corpus-12Feb2019_PARTS.zip:推测为语料库分部分压缩包
- 配置文件(.ant格式,共1个)
- antconc_settings.ant:AntConc工具的设置配置文件
数据来源
大英博物馆ResearchSpace平台(https://public.researchspace.org/sparql)发布的开放链接数据,原始文本源自M. Dorothy George 1935-1954年发表的《大英博物馆版画与素描部藏政治及人物讽刺作品目录》第5至11卷
适用场景
- 语料库语言学研究:用于分析BMSatire Descriptions语料库的语言特征、词汇使用规律
- 策展声音研究:结合关键词、词频等数据,探究策展文本中的叙事风格与话语特征
- 学术论文辅助分析:为相关语言学或博物馆研究论文提供实证数据支持
- 语料库工具应用:通过antconc_settings.ant配置文件,支持AntConc工具对语料库的分析实践