-
WELFake虚假新闻文本分类数据集-studymart
2025年5月31日 30 59 7
WELFake虚假新闻文本分类数据集-studymart 数据来源:互联网公开数据 标签:虚假新闻,文本分类,自然语言处理,机器学习,新闻,真实性,WELFake,文本分析 数据概述:... -
网络评论中仇恨言论检测数据集-2023年-cabmarcos
2025年5月31日 30 156 113
网络评论中仇恨言论检测数据集-2023年-cabmarcos 数据来源:互联网公开数据 标签:仇恨言论,社交媒体,文本分析,自然语言处理,数据清理,文本数据,社交网络,情感分析,数据预处理 数据概述:... -
MDPI平台气候变化相关论文元数据数据集-devrajkashyap
2025年5月31日 30 192 75
MDPI平台气候变化相关论文元数据数据集-devrajkashyap 数据来源:互联网公开数据 标签:气候变化,论文,元数据,MDPI,学术研究,自然语言处理,文本分析 数据概述: 本数据集包含了从MDPI(Multidisciplinary Digital Publishing... -
伊博语重音符号恢复数据集
2025年5月31日 30 43 12
伊博语重音符号恢复数据集 数据来源:互联网公开数据 标签:伊博语,重音符号恢复,自然语言处理,机器学习,文本处理,语言资源 数据概述: 本数据集包含超过50万条经过精心整理的伊博语文本数据,数据来源包括开放获取的伊博语文学文本,如书籍、新闻文章等。数据集经过转录和预处理,旨在为AI模型的训练提供高质量的文本资源,特别是在模式识别领域。 数据用途概述:... -
雅虎问答主题分类数据集-2011至2021年
2025年5月31日 30 32 1
雅虎问答主题分类数据集-2011至2021年 数据来源:互联网公开数据 标签:雅虎问答,主题分类,自然语言处理,信息检索,推荐系统,机器学习,文本分析 数据概述: 本数据集包含从雅虎问答平台收集的有关多个主题的问题及其最佳答案。数据集包括以下几个字段: - topic:问题所属的主题或类别。 - question_title:问题的标题或简短描述。 -... -
商品分类竞赛数据集
2025年5月31日 30 25 22
商品分类竞赛数据集 数据来源:互联网公开数据 标签:商品分类,层次分类,不完全标注,数据融合,自然语言处理,机器学习,分类算法,商品属性,多平台数据,类别预测 数据概述: 本数据集源于DataFusion... -
DBpedia语义分类数据集-14类-2014年-thedevastator
2025年5月31日 30 64 48
DBpedia语义分类数据集-14类-2014年-thedevastator 数据来源:互联网公开数据 标签:DBpedia,语义分类,文本数据集,自然语言处理,机器学习,数据科学,知识图谱,文本分类,分类模型,研究数据集 数据概述:... -
毒性评论分类数据集
2025年5月31日 30 143 16
毒性评论分类数据集 数据来源:互联网公开数据 标签:毒性评论,分类模型,自然语言处理,多语言,情感分析,文本处理,数据预处理 数据概述:... -
-
挪威议会演讲数据集1963-2021
2025年4月14日 60 106 6
挪威议会演讲数据集1963-2021 数据来源:互联网公开数据 标签:挪威议会,演讲,政治党派,时间序列,文本分析,自然语言处理 数据概述:... -
维基百科标题多语言翻译数据集
2025年5月31日 30 3 2
维基百科标题多语言翻译数据集 数据来源:互联网公开数据 标签:维基百科,平行术语库,多语言翻译,印度语言,数据共享,自然语言处理 数据概述:... -
多语言视觉问答数据集
2025年5月31日 30 197 31
多语言视觉问答数据集 数据来源:互联网公开数据 标签:多语言,视觉问答,英语,越南语,日语,图像分析,自然语言处理,跨语言学习 数据概述: 本数据集是首个包含英语、越南语和日语三种语言的多语言视觉问答数据集,包含33,000多个由人工创建的问题-... -
亚马逊商品评论情感细粒度分析数据集-训练与测试集
2025年5月31日 30 100 0
亚马逊商品评论情感细粒度分析数据集-训练与测试集 数据来源:互联网公开数据 标签:亚马逊,商品评论,情感分析,文本数据,机器学习,自然语言处理,训练集,测试集 数据概述:... -
印度Reddit论坛所有帖子数据集2023
2025年5月31日 30 41 30
印度Reddit论坛所有帖子数据集2023 数据来源:互联网公开数据 标签:Reddit,印度论坛,帖子数据,机器学习,文本分析,自然语言处理,数据分析 数据概述: 本数据集包含了印度 Reddit 论坛(r/india)上的所有帖子数据,旨在为构建帖子标签预测模型提供充足的数据支持。数据通过 Pushshift API... -
Reddit社区帖子主题分类数据集-用户帖子内容-多社区-无时间
2025年5月31日 30 153 67
Reddit社区帖子主题分类数据集-用户帖子内容-多社区-无时间 数据来源:互联网公开数据 标签:Reddit,社区,帖子,主题分类,文本分类,自然语言处理,机器学习,社交媒体,推荐系统 数据概述:... -
亚马逊2018年评论数据集
2025年5月31日 30 25 17
亚马逊2018年评论数据集 数据来源:互联网公开数据 标签:亚马逊,评论,评分,自然语言处理,NLP,推荐系统,用户行为,商品分析 数据概述:... -
博客文本-数字内容管理数据集
2025年5月31日 30 78 30
博客文本-数字内容管理数据集 数据来源:互联网公开数据 标签:数字内容管理,博客,作者特征,文本分类,多标签分类,自然语言处理 数据概述:... -
推特趋势话题与用户数据集
2025年5月31日 30 97 84
推特趋势话题与用户数据集 数据来源:互联网公开数据 标签:推特,趋势话题,用户行为,社交网络分析,自然语言处理,聚类分析,推荐系统,机器人检测 数据概述:... -
IMDB电影评论情感分析数据集-2021-mirnasherif
2025年5月31日 30 124 95
IMDB电影评论情感分析数据集-2021-mirnasherif 数据来源:互联网公开数据 标签:IMDB,电影评论,情感分析,NLP,文本分析,机器学习,深度学习,自然语言处理 数据概述: 本数据集来源于IMDB,包含332,220条电影评论,以及对应的电影标题和IMDB的唯一标识符(tconst),旨在支持情感分析任务。数据集包含以下字段:... -
印度语短文本摘要语料库数据集
2025年5月31日 30 151 60
印度语短文本摘要语料库数据集 数据来源:互联网公开数据 标签:印度语,文本摘要,新闻文章,自然语言处理,机器学习,语料库 数据概述: 本数据集包含约330,000篇来自印度新闻网站的文章及其标题,是首个用于基准测试的印度语文本摘要数据集。数据集保留了原文中的标点符号、数字等信息,为研究和开发印度语文本摘要技术提供了丰富的数据基础。 数据用途概述:...