法荷半系词结构生产率与高频标记不利影响复制数据集

数据集概述

本数据集为研究“法荷半系词结构生产率与高频标记不利影响”的论文配套复制数据,包含原始研究的全部数据文件、代码文件及说明文档,支持研究结果的复现与验证,覆盖法荷两种语言的系词结构及语言特征变量数据。

文件详解

  • 说明文档:
  • 00_ReadMe.txt: TXT格式,提供数据集基本信息、联系人及数据说明的自述文件
  • 02_Codebook.pdf: PDF格式,数据集代码本,解释变量定义与编码规则
  • 数据文件:
  • 01a_Final_dataset_productivity.xlsx: XLSX格式,最终数据集,字段含ID、语言、系词性、动词、示例等
  • 01b_Final_dataset_productivity.txt: TXT格式,与XLSX文件内容一致的文本格式数据集
  • 01c_Final_dataset_productivity.csv: CSV格式,与XLSX文件内容一致的CSV格式数据集
  • 代码文件:
  • 03_Final_code_productivity.R: R格式,用于生产率分析的最终代码文件

数据来源

Universiteit Gent & Vrije Universiteit Brussel(联系人Niek Van Wettere)

适用场景

  • 语言学研究: 分析法荷半系词结构的生产率特征及高频标记对语言结构的影响
  • 计算语言学应用: 验证语言生产率相关算法模型在多语言系词结构中的适用性
  • 语言类型学分析: 对比法荷两种语言系词结构的语法特征差异
  • 学术研究复现: 复现原论文关于高频标记不利影响的研究结论
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 13.52 MiB
最后更新 2025年12月10日
创建于 2025年12月10日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。