十尾多轮次视觉推理数据集

数据集概述

本数据集为十尾多轮次视觉推理(10T‑MVR)实验的分析工具包,包含可执行脚本、数据文件及结果输出,支持对五组条件下的多轮对话日志进行生成、分析与可视化,下载后可直接运行分析流程。

文件详解

  • 脚本文件(scripts/目录):
  • run_gpt5_10tails.py:Python脚本,使用图像刺激按条件生成10轮对话JSON日志
  • analyze_10tails_allturns.py:Python脚本,聚合JSON日志并生成CSV统计文件、摘要及图表
  • visualize_10tails_results.py:Python脚本,基于摘要CSV生成额外图像集
  • calculate_10turn_cumulative_stats.py:Python脚本,计算10轮对话累积统计(含图表/LaTeX输出,可选)
  • analyze_10tails_morph_janome.py:Python脚本,使用Janome进行形态学分析(可选)
  • 数据文件(data/目录):
  • raw/:存储原始JSON对话日志
  • stimuli/:存储刺激图像(如stimulus.jpeg)
  • 结果文件(results/目录):
  • CSV文件:metrics_per_turn.csv(每轮指标)、summary_by_condition_turn.csv(按条件×轮次摘要)、final_turn_summary_by_condition.csv(最终轮次条件摘要)
  • plots/:生成的图表文件,包括final_len_chars_bar.png、trend_*_per_kchar.png等
  • cumulative_stats/:可选的累积统计输出
  • results_morph/:形态学分析结果,含CSV统计文件(如morph_metrics_per_turn.csv)及图表文件

数据来源

Zenodo

适用场景

  • 视觉推理研究:分析多轮对话中视觉刺激对推理过程的影响
  • 自然语言处理:探究不同条件下对话内容的特征变化与趋势
  • 实验数据分析:支持多轮次对话实验的自动化统计与可视化
  • 形态学研究:通过可选脚本开展对话文本的形态学特征分析
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 5.62 MiB
最后更新 2025年12月16日
创建于 2025年12月16日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。