动漫图片分享网站Safebooru图片元数据数据集-2018年
数据来源:互联网公开数据
标签:Safebooru,动漫,图片,元数据,标签,图像分析,数据挖掘,图像识别
数据概述:
本数据集包含了2018年5月26日之前,从动漫图片分享网站Safebooru抓取的2,443,000条图片元数据记录。数据提取自Safebooru的API,旨在为图像分析、标签关联研究等提供数据基础。
数据字段包括:
id:图片唯一标识符
creator_id:上传者ID
created_at:上传时间
width:图片宽度
height:图片高度
tags:图片标签,包含多个描述性关键词,可能包含ASCII字符和非ASCII字符(如日文假名、特殊符号)
source:图片来源,可能为空,部分包含非ASCII字符,链接可能失效
file_url:图片下载链接
为简化数据集,移除了部分字段,例如评分(score),因为该字段大部分数值为0,对分析价值有限。
数据用途概述:
该数据集适用于多种研究和应用场景,包括:
图片内容分析:通过分析tags字段,研究动漫图片中的主题、角色、场景等元素之间的关联关系。
标签关联分析:探索不同标签之间的共现关系,例如分析金发与双马尾之间的关联。
图像识别训练:可用于训练图像识别模型,识别动漫图片中的各种特征。
数据挖掘:挖掘Safebooru网站用户的兴趣偏好,了解动漫文化的发展趋势。
数据集也适用于学术研究、个人项目以及对动漫文化感兴趣的爱好者。