数据集概述
本数据集对1945-2017年比利时佛兰芒地区的荷兰语考古文献进行量化分析,涵盖专著、期刊文章、发掘报告等4500余份文献,共5100余万字。为避免版权问题,去除连词、冠词及4字母以下词汇,包含元数据、文本匹配结果、停用词表及处理后数据压缩包,支持研究复现。
文件详解
- METADATA.xlsx
- 文件格式:XLSX
- 字段映射介绍:包含研究复现所需的文献元数据信息
- RESULTS_TEXT_MATCHING.xlsx
- 文件格式:XLSX
- 字段映射介绍:文本匹配分析的结果数据
- STOPLIST.txt
- 文件格式:TXT
- 字段映射介绍:研究中使用的停用词表,包含机构名称等词汇(如Agentschap voor Geografische Informatie Vlaanderen等)
- DATA.zip
- 文件格式:ZIP
- 字段映射介绍:压缩包,包含处理后的考古文献数据
适用场景
- 考古文献量化分析: 利用文本匹配结果研究佛兰芒地区考古文献的主题分布与内容特征
- 考古学研究复现: 通过元数据和处理后数据,复现基于荷兰语考古文献的量化研究
- 历史语言分析: 分析1945-2017年佛兰芒考古文献的语言特征与词汇使用趋势
- 考古文献资源整理: 基于元数据对佛兰芒地区考古文献资源进行系统化梳理与分类