Appendix_F_基于信息论的人称代词跨语言变异研究数据

数据集概述

本数据集是论文《They saw it, onu, 它, coming: An information theoretic study of cross-linguistic variation in personal pronouns》的附录F,包含人称代词跨语言变异信息论研究的相关分析数据,具体涵盖brm分析结果、代词频率统计、词长与 surprisal/AUC 相关性数据、系数表及模型热图等内容,以压缩包形式提供。

文件详解

  • 文件名称:appendixF.zip
  • 文件格式:ZIP
  • 包含内容:
  • brms/目录:个人和多语言brms模型(针对surprisal和AuC)、系数数据及Rdata文件
  • grads_auc/目录:AUC值数据集
  • heatmap_brms_estimates_all.png:brms模型估计值和系数的热图
  • pron_locs_scored/目录:surprisal值数据集
  • 其他相关数据:代词频率(与各语言mini-CIEP+语料库规模相关)、surprisal/AUC与词长的相关性数据、系数表

数据来源

论文《They saw it, onu, 它, coming: An information theoretic study of cross-linguistic variation in personal pronouns》附录F

适用场景

  • 语言学信息论研究:分析人称代词在跨语言环境中的信息论特征及变异规律
  • 统计模型验证:利用brm分析结果和系数表验证人称代词相关统计模型的有效性
  • 语料库语言学分析:基于各语言mini-CIEP+语料库规模的代词频率数据,研究语言使用特征
  • 数据可视化研究:通过模型热图展示brms模型估计值和系数的分布特征
  • 语言特征相关性分析:探究词长与surprisal/AUC值的相关性,挖掘语言结构规律
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 114.65 MiB
最后更新 2026年1月29日
创建于 2026年1月29日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。