-
AI相关推文情感分类数据集
AI相关推文情感分类数据集 数据来源:互联网公开数据 标签:AI,推文,情感分析,自然语言处理,机器学习,数据标注,人类评估 数据概述: 本数据集包含经过处理的文本数据,旨在为大型语言模型的训练提供合适的提示。这些提示集成了预期的输出,常用于语言模型的监督微调。提示结构化为明确的输入-... -
印度区域语言命名实体识别标注数据集
印度区域语言命名实体识别标注数据集 数据来源:互联网公开数据 标签:命名实体识别,印度语言,数据标注,自然语言处理,Tamil,NER,区域语言 数据概述:... -
心理模型数据集
心理模型数据集 数据来源:互联网公开数据 标签:心理学, 人格特质, 五大人格模型, 机器学习, 数据标注, 数据标准化 数据概述: 本数据集基于互联网公开的心理学人格测试数据,经过系统化的标注和处理,适合用于心理研究和机器学习应用场景。原始数据来自“Big Five Personality... -
工程符号数据集
工程符号数据集 数据来源:互联网公开数据 标签:工程符号,图像识别,目标检测,机器学习,数据标注,PDF处理 数据概述: 本数据集包含近1000张标注并框选的图像,涉及少于250种工程符号。每种符号均经过三次旋转处理(分别对应北、南、东、西四个方向,其中北方向为原始方向),旨在提高模型的鲁棒性。 数据用途概述:... -
印度尼西亚仇恨言论语言分析数据集
印度尼西亚仇恨言论语言分析数据集 数据来源:互联网公开数据 标签:仇恨言论,语言分析,机器学习,文本挖掘,情绪分析,社会影响,数据标注 数据概述:... -
-
基于文本的分类数据集
基于文本的分类数据集 数据来源:互联网公开数据 标签:文本分类,区块链,机器学习,自然语言处理,数据标注,监督学习,领域特定文本 数据概述 本数据集旨在基于文本内容对样本进行分类,数据来源于区块链领域相关的文本资料。数据集包含两部分内容: -... -
-
尼泊尔美食MOMO图像数据集
尼泊尔美食MOMO图像数据集 数据来源:互联网公开数据 标签:尼泊尔美食, MOMO, 图像分类, 目标检测, 数据标注, 人工智能, 计算机视觉 数据概述: 本数据集精选了尼泊尔特色美食MOMO的高质量图像,包含若干张经过人工标注的清晰图片。每张图像均经过专业标注,确保标注的准确性和一致性,为训练目标检测模型提供了可靠的数据基础。 数据用途概述:... -
-
印度尼西亚电商平台产品评论数据集
印度尼西亚电商平台产品评论数据集 数据来源:互联网公开数据 标签:产品评论,印度尼西亚,电商平台,情感分析,机器学习,数据标注,网络抓取 数据概述:... -
汽车旋转角度数据集
汽车旋转角度数据集 数据来源:互联网公开数据 标签:自动驾驶,图像处理,目标检测,旋转角度,计算机视觉,汽车识别,数据标注 数据概述: 本数据集来源于Peking... -
突尼斯语社交媒体情感分析数据集2023
突尼斯语社交媒体情感分析数据集2023 数据来源:互联网公开数据 标签:突尼斯语,社交媒体,情感分析,NLP,数据标注,评论,帖子 数据概述: 本数据集包含了超过40000条来自Facebook的评论和帖子,其中约10000条评论已被标注为正面、负面或中性。这些数据为自然语言处理(NLP)任务提供了丰富的资源,特别适用于情感分析研究。 数据用途概述:... -
印度情绪分析社交媒体数据集2023
印度情绪分析社交媒体数据集2023 数据来源:互联网公开数据 标签:情绪分析,社交媒体,推特,英语,情感分类,数据标注,自然语言处理 数据概述: 本数据集包含通过Twitter... -
推特天气情感评估准确性众包数据集
推特天气情感评估准确性众包数据集 数据来源:互联网公开数据 标签:推特,天气,情感分析,众包,数据标注,自然语言处理,社交媒体,数据质量,情感分类 数据概述:... -
深度伪造视频真假音频识别数据集-基于DFDC挑战赛数据
深度伪造视频真假音频识别数据集-基于DFDC挑战赛数据 数据来源:互联网公开数据 标签:视频伪造检测,音频伪造检测,深度伪造,DFDC,数据标注,机器学习,人工智能 数据概述: 本数据集包含DFDC(Deepfake Detection... -
虚假新闻分类数据集2016-2019
虚假新闻分类数据集2016-2019 数据来源:互联网公开数据 标签:虚假新闻,新闻分类,新闻来源,文本分析,机器学习,数据标注 数据概述:... -
-
COVID-19信息流行病数据集
COVID-19信息流行病数据集 数据来源:互联网公开数据 标签:COVID-19,信息流行病,社交媒体分析,真实信息,虚假信息,数据标注,健康信息 数据概述:... -
联系表单垃圾邮件数据集
联系表单垃圾邮件数据集 数据来源:互联网公开数据 标签:联系表单,垃圾邮件,机器学习,分类模型,数据清洗,数据标注,非商业用途,CC BY-NC 4.0许可 数据概述: 本数据集包含超过2,000条来自多个网站的垃圾邮件联系表单提交记录。该数据集可用于构建分类机器学习模型或其他垃圾邮件过滤系统。目前,数据集仍在持续更新中,预计未来将包含更多数据。...