五尾多轮视觉推理数据集

数据集概述

该数据集围绕五尾多轮视觉推理(5T‑MVR)构建,包含评估五种提示条件(BASELINE、OBSERVE、ANALYZE、EVALUATE、INTERPRET)在五轮图像刺激对话中的脚本、样本数据、结果文件及说明文档,支持通过OpenAI API生成日志、分析对话轮次并生成可视化结果。

文件详解

  • 压缩文件:5T‑MVR.zip(ZIP格式),包含以下目录及文件:
  • scripts/目录:含生成日志、分析所有轮次、可视化结果的Python脚本
  • data/raw/目录:样本JSON日志文件
  • data/stimuli/目录:示例图像文件(stimulus.jpeg)
  • results/目录:CSV格式的统计结果文件(如按条件和轮次的汇总表、每轮指标表)及plots/子目录下的可视化图表
  • README.md、README_jp.md:运行说明文档
  • CITATION.cff:引用格式文件
  • LICENSES/目录:包含代码(MIT)和内容(CC BY 4.0)的许可证文件

适用场景

  • 视觉推理研究:评估多轮对话中不同提示条件对视觉推理任务的影响
  • 大语言模型评估:测试GPT-5等模型在图像刺激下的多轮对话推理能力
  • 对话系统分析:研究多轮对话中推理指标(长度趋势、类别密度等)的变化规律
  • 可复现性研究:基于提供的脚本和说明复现视觉推理评估实验结果
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 3.41 MiB
最后更新 2025年12月20日
创建于 2025年12月20日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。