数据集概述
本数据集为AI模型福利研究的一部分,聚焦Claude 4 Sonnet和GPT-4o两款大语言模型(LLM)声称的联觉体验,核心记录其对星期几对应的颜色感知数据。包含8个文件,覆盖原始交互数据、颜色频率统计、平均颜色及摘要信息,支持分析LLM的类感知行为特征。
文件详解
- 交互数据文件
- 文件名称:claude_combined_color_io.csv、gpt_combined_color_io.csv
- 文件格式:CSV
- 字段映射介绍:包含conversation_id(会话ID)、timestamp(时间戳)、question_id(问题ID)、category(类别)、repetition(重复次数)、question(问题内容)、response(模型回答)、tokens_sent(发送 tokens 数)、tokens_received(接收 tokens 数)、status(状态)等交互过程数据
- 颜色频率统计文件
- 文件名称:claude_top_colors.csv、gpt_top_colors.csv
- 文件格式:CSV
- 字段映射介绍:包含Day(星期)、Color(颜色)、Frequency(频率),记录模型对各星期对应颜色的高频输出统计
- 平均颜色统计文件
- 文件名称:claude_average_colors.csv、gpt_average_colors.csv
- 文件格式:CSV
- 字段映射介绍:推测包含星期与对应平均颜色的统计数据(基于命名逻辑)
- 颜色摘要文件
- 文件名称:claude_color_summary.json、gpt_color_summary.json
- 文件格式:JSON
- 字段映射介绍:推测为模型星期颜色联觉数据的结构化摘要信息(基于命名逻辑)
数据来源
SentiMentality Model Welfare Research项目
适用场景
- AI模型福利研究:分析LLM声称的联觉体验,探索其类心理行为特征
- 大语言模型认知模拟:研究LLM对抽象概念(星期)的具象化(颜色)映射规律
- 模型行为一致性评估:对比Claude 4 Sonnet与GPT-4o在联觉输出上的差异与共性
- 自然语言交互数据挖掘:基于原始交互记录,分析问题设计对模型响应的影响