图像视觉感知用户聚类分析数据集
数据来源:互联网公开数据
标签:图像,聚类,用户感知,视觉,NUS-WIDE,亚马逊MTurk,特征,图像检索,计算机视觉
数据概述:
本数据集由台湾清华大学吴善雄及其数据实验室成员收集,旨在研究用户对图像的视觉感知。数据集基于NUS-WIDE图像数据库随机抽样的180张图像,每张图像提取了500个基于SIFT描述子的词袋特征。通过在亚马逊Mechanical Turk平台上进行实验,收集了来自100位用户的325个用户感知的聚类及其对应的描述。
数据集包含以下三个核心文件:
cluster_data.csv:聚类数据矩阵,维度为325(聚类)x 180(图像)。该矩阵为指示矩阵,M(i,j) = 1表示图像j属于聚类i。需要注意的是,不同的聚类可能由不同的用户创建。
cluster_userIndex.csv:聚类用户索引向量,维度为325(聚类)x 1(用户索引)。该向量记录了每个聚类对应的用户索引,V(i) = k表示聚类i是由用户k(0-99)创建的。
data_feature.csv:图像特征数据矩阵,维度为180(图像)x 500(特征)。每行代表一张图像的500维特征向量,这些特征是基于SIFT描述子的词袋模型提取的。所有180张图像均来自NUS-WIDE数据集。
此外,数据集还包含108个用于监督的词汇。
数据用途概述:
该数据集适用于图像聚类分析、用户视觉感知研究、图像检索、以及计算机视觉相关领域的研究。研究人员可以利用该数据探索用户如何感知和组织图像,评估不同聚类算法的性能,研究用户主观认知与客观特征之间的关系。此外,该数据集也适合用于图像检索系统的评估和改进,以及构建基于用户感知的图像推荐系统。