-
NewsUnravel媒体偏见检测数据集2023
2025年12月21日 30 195 34
数据集概述 该数据集通过NewsUnravel网站的用户反馈机制收集,包含新闻文章中机器生成偏见高亮句的读者反馈数据,含偏见句子二元标签、文章元数据及用户反馈记录,用于提升媒体偏见检测模型性能,是首个媒体偏见领域人在回路数据收集应用的成果。 文件详解 该数据集包含6个文件,具体说明如下: - NUDAdataset.csv:...
-
绿色声明数据集
2025年12月19日 30 127 47
数据集概述 该数据集包含化妆品和电子领域企业的773条推文,每条推文标注了绿色声明的二元标签(是/否)和多分类标签(显性/隐性/非绿色声明),为研究企业绿色营销沟通提供标注数据支持。 文件详解 数据文件: green_claims.csv:CSV格式,包含字段映射: id:推文唯一标识 tweet:推文文本内容 username:发布推文的企业用户名...
-
视觉实体隐私学习数据集
2025年12月12日 30 205 161
数据集概述 本数据集包含用于视觉实体隐私学习研究的精选图像隐私数据集及预计算视觉实体。涵盖PicAlert、VISPR、PrivacyAlert等原始数据集的整理版本,图像来自Flickr,标注为公开或私有二元标签,存在公开类高不平衡性,支持灵活数据拆分与模型训练。 文件详解 精选图像隐私数据集:...
-
企业邮件垃圾分类样本数据集
2025年6月19日 30 113 54
数据来源: 该数据集由美国能源公司 Enron 的内部通信记录构成,原始数据整理自 Enron Email Dataset,后经分类标注为“垃圾邮件”与“正常邮件”(Spam/Ham)两类,用于自然语言处理任务中的文本分类研究。 字段定义: Message ID:邮件编号,唯一标识每封邮件 Subject:邮件主题 Message:邮件正文内容...



