数据集概述
本数据集为评估Chat GPT(AI大语言模型)医疗伦理能力的研究数据,基于《Oxford Assess and Progress: Situational Judgement Test》书中252道SJT题目(含82道选择题、170道排序题)构建,记录模型回答与标准答案的对比结果,用于分析模型在医疗情境下的伦理判断准确性及一致性。
文件详解
- 文件名称:
SJT database.xlsx
- 文件格式:XLSX
- 字段映射介绍:推测包含SJT题目内容、题目类型(选择题/排序题)、测试领域分类、Chat GPT回答结果、标准答案、准确性判定等核心字段,支撑模型伦理能力评估分析
数据来源
论文“Assessing Chat GPT's ethical proficiency by testing it's performance at the Situational Judgement Test”
适用场景
- 医疗伦理AI能力评估: 分析Chat GPT在医疗情境判断测试中的准确性、一致性及伦理决策表现
- AI模型伦理局限性研究: 基于测试结果探究大语言模型在医疗伦理场景下的能力边界与不足
- 医疗AI辅助工具开发: 为优化AI辅助医生伦理决策工具提供数据参考
- 医疗教育测试应用: 探索SJT测试在AI医疗伦理能力评估中的标准化应用价值