找到1个数据集

标签: SJT测试数据

过滤结果
  • SJT_Situational_Judgement_Test_Chat_GPT医疗伦理能力评估数据集

    2026年1月4日 30 127 52

    数据集概述 本数据集为评估Chat GPT(AI大语言模型)医疗伦理能力的研究数据,基于《Oxford Assess and Progress: Situational Judgement Test》书中252道SJT题目(含82道选择题、170道排序题)构建,记录模型回答与标准答案的对比结果,用于分析模型在医疗情境下的伦理判断准确性及一致性。...
    packageimg