DIG4EL通用智能体116种语言规范词序测试结果数据集

数据集概述

该数据集包含DIG4EL通用智能体(GA)针对116种语言规范词序的测试结果。智能体基于7个可自动观测的词序参数,推断8个未知词序参数,采用留一法(Leave-One-Out)测试,每种语言独立测试11个轮次(epochs),数据为软件输出的原始真值表。

文件详解

  • 文件名称: truth_tables.zip
  • 文件格式: ZIP压缩包(.zip)
  • 文件内容: 包含116种语言每轮次测试的原始真值表,每个参数预测结果以0(失败)或1(成功)编码,记录智能体对未知词序参数的推断表现。

适用场景

  • 计算语言学研究: 分析智能体对多语言词序参数的推断能力与准确性
  • 语言类型学分析: 探索116种语言规范词序参数的分布规律及关联性
  • 自然语言处理模型评估: 评估通用智能体在跨语言结构预测任务中的性能
  • 语言数据挖掘: 基于测试结果挖掘影响词序参数预测的关键因素
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.54 MiB
最后更新 2025年12月4日
创建于 2025年12月4日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。