Safebooru网站图像标签使用统计数据集-2018

Safebooru网站图像标签使用统计数据集-2018 数据来源:互联网公开数据 标签:Safebooru,图像标签,标签统计,频率分析,动漫,二次元,标签类型,数据挖掘 数据概述: 本数据集基于Safebooru网站的图像元数据,提供了该网站图像标签的使用统计信息。数据包含两个版本:完整标签集和带标签类型标签集。完整标签集包含369,289个标签及其使用频率;带标签类型的标签集包含15,283个标签,以及Safebooru定义的标签类型和使用频率。

需要注意的是,由于使用了Trie数据结构存储标签,部分包含非ASCII字符的标签(如⑨)在处理过程中被排除。此外,部分标签类型被手动修改,例如,将原本标记为“ambiguous”(歧义)的标签进行忽略处理。

数据用途概述: 该数据集可用于标签使用频率分析、标签类型研究、动漫图像内容分析等多种场景。研究人员可以利用此数据分析Safebooru网站上最常用的标签,以及不同标签类型的分布情况;开发者可以利用此数据进行标签推荐和搜索优化;数据分析师可以基于此数据进行用户行为分析和内容趋势预测。此外,该数据集也可用于教育和研究,帮助了解动漫文化中标签的使用习惯和特点。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 2.76 MiB
最后更新 2025年4月14日
创建于 2025年4月14日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。