数据集概述
本数据集包含通过参考使用采样创建的德语历时词使用图(WUGs),版本为1.1.0,发布于2021年12月15日。数据用于分析德语词汇在不同时间语境下的语义变化,可通过WUGsite获取数据格式说明、处理代码及更多相关数据集,核心文件为压缩包形式。
文件详解
- 文件名称:refwug.zip
- 文件格式:ZIP(压缩包)
- 字段映射介绍:压缩包内包含德语历时参考词使用图(WUGs)相关数据,具体字段需解压后查看,数据格式及处理方法可参考WUGsite或相关论文说明。
数据来源
论文“Clustering Word Usage Graphs: A Flexible Framework to Measure Changes in Contextual Word Meaning”(Dominik Schlechtweg and Sabine Schulte im Walde提交)
适用场景
- 语义变化研究:分析德语词汇在不同时间维度下的语境意义演变规律。
- 自然语言处理模型训练:为词使用图聚类、语义变化检测等NLP任务提供训练数据。
- 语言学研究:探究德语词汇使用模式的历时变化特征。
- 计算语言学工具开发:支持基于词使用图的语义分析工具构建。