找到1个数据集

标签: 人类考官

过滤结果
  • GPT_4_Based_学术论文评分能力对比研究数据集

    2026年1月30日 30 95 39

    数据集概述 本数据集来自论文“GPT-4 Shows Comparable Performance to Human Examiners in Ranking Open-Text Answers”,包含三个Excel文件,记录GPT-4与人类考官对开放式文本答案的评分对比数据,涉及多答案排序、分数评估及鲁棒性检验,用于验证GPT-4的评分能力。...
    packageimg