数据集概述
本数据集为十尾多轮次视觉推理(10T‑MVR)实验的分析工具包,包含可执行脚本、数据文件及结果输出,支持对五组条件下的多轮对话日志进行生成、分析与可视化,下载后可直接运行分析流程。
文件详解
- 脚本文件(scripts/目录):
- run_gpt5_10tails.py:Python脚本,使用图像刺激按条件生成10轮对话JSON日志
- analyze_10tails_allturns.py:Python脚本,聚合JSON日志并生成CSV统计文件、摘要及图表
- visualize_10tails_results.py:Python脚本,基于摘要CSV生成额外图像集
- calculate_10turn_cumulative_stats.py:Python脚本,计算10轮对话累积统计(含图表/LaTeX输出,可选)
- analyze_10tails_morph_janome.py:Python脚本,使用Janome进行形态学分析(可选)
- 数据文件(data/目录):
- raw/:存储原始JSON对话日志
- stimuli/:存储刺激图像(如stimulus.jpeg)
- 结果文件(results/目录):
- CSV文件:metrics_per_turn.csv(每轮指标)、summary_by_condition_turn.csv(按条件×轮次摘要)、final_turn_summary_by_condition.csv(最终轮次条件摘要)
- plots/:生成的图表文件,包括final_len_chars_bar.png、trend_*_per_kchar.png等
- cumulative_stats/:可选的累积统计输出
- results_morph/:形态学分析结果,含CSV统计文件(如morph_metrics_per_turn.csv)及图表文件
数据来源
Zenodo
适用场景
- 视觉推理研究:分析多轮对话中视觉刺激对推理过程的影响
- 自然语言处理:探究不同条件下对话内容的特征变化与趋势
- 实验数据分析:支持多轮次对话实验的自动化统计与可视化
- 形态学研究:通过可选脚本开展对话文本的形态学特征分析