新冠疫情有害信息图像数据集_COVID_19_Harmful_Information_Image_Dataset
数据来源:互联网公开数据
标签:新冠疫情, 图像识别, 恶意信息, 社交媒体, 图像分类, 文本分析, 情感分析, 机器学习
数据概述:
该数据集包含来自社交媒体平台(如Twitter等)的图像数据,记录了与新冠疫情相关的有害信息。主要特征如下:
时间跨度:数据未明确标注时间,但根据内容推测,主要集中在2020年新冠疫情爆发期间。
地理范围:数据内容涉及全球范围,但主要以英语为主。
数据维度:数据集包括“image”(图像文件名)、“labels”(标签,标注图像是否包含有害信息,包括“harmful”和“not harmful”两种)和“text”(图像中的文本内容)三个字段。
数据格式:数据以CSV格式提供,文件名为haemful_meme_for_covid19.csv,其中包含了图像文件名、图像标注及图像内文本信息。图像文件以PNG格式存储。
来源信息:数据来源于社交媒体平台,可能经过人工或自动化方式收集与标注,旨在识别和分析与新冠疫情相关的有害信息。
该数据集适合用于图像识别、文本分析、情感分析和机器学习等领域的研究。
数据用途概述:
该数据集具有广泛的应用潜力,特别适用于以下场景:
研究与分析:适用于社交媒体信息分析、恶意信息检测、疫情期间公众情绪分析等研究,例如,研究有害信息传播模式、分析不同群体对疫情的看法等。
行业应用:可以为社交媒体平台提供数据支持,用于开发有害信息过滤系统、提升内容审核效率、优化用户体验。
决策支持:支持公共卫生部门和政府机构进行疫情期间的信息监测和风险评估,辅助制定应对策略。
教育和培训:作为人工智能、自然语言处理、图像识别等课程的实训素材,帮助学生和研究人员深入理解相关技术。
此数据集特别适合用于探索社交媒体上与新冠疫情相关的有害信息的传播规律,帮助用户构建有效的有害信息检测模型,提升公众对疫情信息的辨别能力。