-
RoMEMES_Source_罗马尼亚社交媒体表情包多模态标注数据
2026年1月27日 30 78 25
数据集概述 本数据集为罗马尼亚语表情包数据集RoMEMES,采集自公共社交媒体平台,包含表情包的文本、图像及相关标注信息。数据经人工标注罗马尼亚语文本、图像复杂度、情感倾向、政治内容属性,文本部分通过RELATE平台自动标注词性、词元及依存句法,同时包含元数据。 文件详解 metadata.tsv 文件格式:TSV...
-
Debates_Eleitorais_2014_Based_巴西总统选举辩论Twitter表情包图像数据集
2025年12月31日 30 59 16
数据集概述 本数据集包含2014年巴西主要电视台播出总统选举辩论期间,通过Twicsy应用从Twitter收集的表情包图像压缩文件,共8个文件,记录了不同辩论场次、电视台对应的社交媒体表情包内容。 文件详解 文件名称:TURNO2_DEB_RECORD_19102014.zip 文件格式:ZIP...
-
泰米尔语表情包恶意内容分类数据集
2025年12月20日 30 201 18
数据集概述 本数据集是针对泰米尔语表情包的恶意内容分类资源,包含标注为“恶意”和“非恶意”的表情包图像,以及对应的拉丁转写文本,旨在支持印度语言表情包恶意内容的计算建模研究。 文件详解 文件名称: Tamil_troll_memes-dataset.zip 文件格式: ZIP压缩包 内容说明:...
-
罗马尼亚语言表情包数据集v2
2025年12月5日 30 118 60
数据集概述 该数据集为罗马尼亚语言表情包数据集v2,包含从公共社交媒体平台收集的罗马尼亚语表情包,提供手动标注(文本内容、图像复杂度、极性、情感、政治内容)及自动标注(词性标签、词元、依存句法分析)信息,支持多维度分析。 文件详解 核心文件: metadata.tsv: TSV格式,含文件ID、元数据及手动标注信息 LICENSE: 许可信息文件...



