找到2个数据集

标签: 语言特征分布

过滤结果
  • 跨主题作者归属大型语料库FICSIT

    2025年12月23日 30 28 4

    数据集概述 该数据集是精准控制跨主题样本的作者归属语料库,基于StackExchange平台数据构建,包含1237位作者的188077条文本样本,覆盖308个主题,未进行额外预处理,为跨主题作者归属研究提供基础数据。 文件详解 文件名称: FICSIT.zip:压缩包格式,包含跨主题作者归属的文本样本数据,具体字段需解压后查看 文件名称:...
    packageimg
  • 斯拉夫形态句法地理与接触配置关联数据集

    2025年12月20日 30 66 57

    数据集概述 本数据集为论文《斯拉夫形态句法主要由其地理位置和接触配置决定》的原始数据,包含与斯拉夫语言形态句法特征相关的指标数据,涉及语言属性、地理区域、人称标记等维度,支持相关语言特征与地理及接触因素关联的研究。 文件详解...
    packageimg