动漫图片分享网站Safebooru图片元数据数据集-2018年

动漫图片分享网站Safebooru图片元数据数据集-2018年

数据来源:互联网公开数据

标签:Safebooru,动漫,图片,元数据,标签,图像分析,数据挖掘,图像识别

数据概述: 本数据集包含了2018年5月26日之前,从动漫图片分享网站Safebooru抓取的2,443,000条图片元数据记录。数据提取自Safebooru的API,旨在为图像分析、标签关联研究等提供数据基础。

数据字段包括:

id:图片唯一标识符 creator_id:上传者ID created_at:上传时间 width:图片宽度 height:图片高度 tags:图片标签,包含多个描述性关键词,可能包含ASCII字符和非ASCII字符(如日文假名、特殊符号) source:图片来源,可能为空,部分包含非ASCII字符,链接可能失效 file_url:图片下载链接

为简化数据集,移除了部分字段,例如评分(score),因为该字段大部分数值为0,对分析价值有限。

数据用途概述: 该数据集适用于多种研究和应用场景,包括:

图片内容分析:通过分析tags字段,研究动漫图片中的主题、角色、场景等元素之间的关联关系。 标签关联分析:探索不同标签之间的共现关系,例如分析金发与双马尾之间的关联。 图像识别训练:可用于训练图像识别模型,识别动漫图片中的各种特征。 数据挖掘:挖掘Safebooru网站用户的兴趣偏好,了解动漫文化的发展趋势。 数据集也适用于学术研究、个人项目以及对动漫文化感兴趣的爱好者。

数据与资源

附加信息

字段
版本 1.0
最后更新 五月 31, 2025, 10:28 (UTC)
创建于 五月 31, 2025, 10:27 (UTC)