文化概念图像描述数据集
数据来源:互联网公开数据
标签:文化,图像描述,视觉语言模型,文化意识评分,全球文化,舞蹈,艺术符号,跨文化研究
数据概述:
本数据集包含1500张文化概念的图像,每张图像都经过人工标注,提供真实标签和文化意识评分(Cultural Awareness Score,简称CAS)。数据集分为三个主要类别:
1) 来自不同文化的舞蹈图像,包括印度古典舞蹈(如 Bharatnatyam、Kathak、Kathakali、Manipuri、Kuchipudi 和 Odissi)及其他国家的舞蹈和舞蹈服饰;
2) 不同文化概念的图像,如 amulet、angel、Anubis、Centaur、Cornucopia、Daruma doll、Dharma Wheel、Dreamcatcher、Gargoyle、Hamsa、Kokopelli、Mandala、Maypole、Merkabah、Nymph、Pagoda、Sphinx、Torii、Wyvern 等;
3) 各国文化符号和标志,如 Pok-ta-pok、Kawak、Cernunnos、Awen 等,大部分为矢量图像。
更新版本新增了两个字段:'concept_name'(文化概念名称)和 'concept_origin'(文化概念的起源地区或国家)。
数据用途概述:
该数据集适用于以下场景:
1) 评估视觉语言模型的文化感知能力;
2) 研究跨文化背景下图像描述的差异性;
3) 探索不同文化符号和概念的视觉表现;
4) 支持文化理解与文化意识相关的学术研究;
5) 用于教育和培训,帮助学习者理解不同文化背景下的视觉表达。