-
雅虎问答10类别NLP数据集
2025年6月1日 30 150 5
雅虎问答10类别NLP数据集 数据来源:互联网公开数据 标签:问答分类,自然语言处理,NLP,文本分类,问答系统,文本分析,机器学习,主题分类 数据概述:... -
维基百科-事物-主题相关页面数据分析数据集
2025年6月1日 30 66 13
维基百科-事物-主题相关页面数据分析数据集 数据来源:互联网公开数据 标签:维基百科,事物,知识图谱,文本分析,自然语言处理,主题分类,信息检索 数据概述:... -
俄罗斯电报频道多分类数据集
2025年5月31日 30 10 3
俄罗斯电报频道多分类数据集 数据来源:互联网公开数据 标签:电报频道,俄语,多分类,文本分析,社交媒体,主题分类,自然语言处理 数据概述: 本数据集包含俄罗斯语言电报频道的贴文文本及其主题标签。每个贴文可以被标注为多个主题类别,涵盖广泛的议题和内容类型。数据集旨在反映俄语社交媒体内容的多样性和复杂性,为文本分类和主题分析提供可靠的数据基础。... -
雅虎问答主题分类数据集-2011至2021年
2025年5月31日 30 186 86
雅虎问答主题分类数据集-2011至2021年 数据来源:互联网公开数据 标签:雅虎问答,主题分类,自然语言处理,信息检索,推荐系统,机器学习,文本分析 数据概述: 本数据集包含从雅虎问答平台收集的有关多个主题的问题及其最佳答案。数据集包括以下几个字段: - topic:问题所属的主题或类别。 - question_title:问题的标题或简短描述。 -... -
Reddit社区帖子主题分类数据集-用户帖子内容-多社区-无时间
2025年5月31日 30 157 94
Reddit社区帖子主题分类数据集-用户帖子内容-多社区-无时间 数据来源:互联网公开数据 标签:Reddit,社区,帖子,主题分类,文本分类,自然语言处理,机器学习,社交媒体,推荐系统 数据概述:... -
俄罗斯Telegram频道文章文本与主题分类数据集
2025年5月31日 30 147 143
俄罗斯Telegram频道文章文本与主题分类数据集 数据来源:互联网公开数据 标签:Telegram,社交媒体,俄罗斯,文本分析,主题分类,语言学,舆情分析,新闻,政治 数据概述: 本数据集包含了俄罗斯语Telegram频道帖子的标注文本。数据的主要组成部分是帖子的文本内容以及对应的主题分类标签。 数据用途概述:... -
维基百科百万标签主题分类数据集-nikbearbrown
2025年5月31日 30 130 119
维基百科百万标签主题分类数据集-nikbearbrown 数据来源:互联网公开数据 标签:维基百科,标签,主题分类,自然语言处理,主题建模,数据挖掘,研究,知识领域 数据概述:... -
文本情感分类与主题识别数据集TextSentimentClassificationandTopicRecognitionDataset-thne1111
2025年5月28日 30 53 38
文本情感分类与主题识别数据集TextSentimentClassificationandTopicRecognitionDataset-thne1111 数据来源:互联网公开数据 标签:文本情感分析, 主题分类, 多分类模型, 情感识别, 文本挖掘, 自然语言处理, 机器学习, 语料库 数据概述:... -
文本情感分析与主题分类数据集TextSentimentAnalysisandTopicClassificationDataset-igorlitvin
2025年5月28日 30 196 60
文本情感分析与主题分类数据集TextSentimentAnalysisandTopicClassificationDataset-igorlitvin 数据来源:互联网公开数据 标签:文本情感分析, 情感分类, 主题分类, 机器学习, 自然语言处理, 文本语料, 数据标注, 情感极性 数据概述:... -
科技新闻文本主题分析数据集TechnologyNewsTextTopicAnalysisDataset-annabad
2025年5月15日 30 33 26
科技新闻文本主题分析数据集TechnologyNewsTextTopicAnalysisDataset-annabad 数据来源:互联网公开数据 标签:新闻文本, 科技, 主题分类, 文本挖掘, 自然语言处理, 数据清洗, 机器学习, 语料库 数据概述: 该数据集包含来自互联网的新闻文本数据,记录了科技领域相关新闻的文本内容及其主题分类。主要特征如下:... -
德语新闻文章主题提取数据集-2011-whenamancodes
2025年5月6日 30 63 24
德语新闻文章主题提取数据集-2011-whenamancodes 数据来源:互联网公开数据 标签:NLP,德语,新闻文章,主题分类,数据集,学术研究,机器学习,新闻学 数据概述:... -
推特文本情感与主题分类数据集TwitterTextSentimentandTopicClassificationDataset-eddamghi
2025年5月6日 30 93 46
推特文本情感与主题分类数据集TwitterTextSentimentandTopicClassificationDataset-eddamghi 数据来源:互联网公开数据 标签:推特文本, 情感分析, 主题分类, 文本分类, 自然语言处理, 机器学习, 社交媒体, 舆情分析 数据概述:... -
虚假新闻文本主题分析数据集FakeNewsTextSubjectAnalysis-tonkla41
2025年5月1日 30 206 131
虚假新闻文本主题分析数据集FakeNewsTextSubjectAnalysis-tonkla41 数据来源:互联网公开数据 标签:虚假新闻,文本分析,主题分类,新闻报道,文本挖掘,情感分析,社会媒体,信息安全 数据概述: 该数据集包含来自社交媒体和新闻网站的文本数据,记录了虚假新闻和真实新闻的文本内容。主要特征如下:... -
Twitter推文情感与主题分类数据集TwitterTweetSentimentandTopicClassification-younessaithassoune
2025年4月29日 30 80 55
Twitter推文情感与主题分类数据集TwitterTweetSentimentandTopicClassification-younessaithassoune 数据来源:互联网公开数据 标签:推文分析, 情感分析, 主题分类, 自然语言处理, 社交媒体, 机器学习, 文本挖掘, 舆情分析 数据概述:... -
主题分类交叉验证数据集TopicClassificationCross-ValidationDataset-moritake04
2025年4月29日 30 85 84
主题分类交叉验证数据集TopicClassificationCross-ValidationDataset-moritake04 数据来源:互联网公开数据 标签:主题分类, 交叉验证, 文本分析, 数据分割, 机器学习, 模型评估, 文本挖掘, 分类任务 数据概述:... -
GermEval18文本分类数据集-thedevastator
2025年4月22日 60 85 13
GermEval18文本分类数据集-thedevastator 数据来源:互联网公开数据 标签:文本分类,情感分析,主题分类,二元分类,多类分类,自然语言处理,机器学习 数据概述:... -
文本摘要与主题分类数据集LCSTS数据集-yojn710
2025年4月25日 30 160 30
文本摘要与主题分类数据集LCSTS数据集-yojn710 数据来源:互联网公开数据 标签:文本摘要,主题分类,自然语言处理,机器学习,数据集,中文,深度学习,NLP 数据概述: 该数据集包含来自新浪微博的中文文本数据,主要用于文本摘要和主题分类任务。主要特征如下: 时间跨度:数据记录的时间范围未知,但主要来源于社交媒体平台。... -
全球新闻长上下文模型数据集
2025年4月25日 30 123 10
全球新闻长上下文模型数据集 数据来源:互联网公开数据 标签:全球新闻,长上下文模型,新闻分析,主题分类,数据挖掘,自然语言处理,信息抽取 数据概述: 本数据集基于CC-News,包含来自全球的新闻文章,经过主题筛选,适合用于长上下文模型的演示。数据集通过关键词过滤方法,如“AI突破”、“绿色科技”等,筛选出与特定主题相关的文章。 数据用途概述:... -
主题分类数据集TopicsClassificationDataset-luisfredgs
2025年4月25日 30 193 183
主题分类数据集TopicsClassificationDataset-luisfredgs 数据来源:互联网公开数据 标签:主题分类,数据集,文本分析,机器学习,自然语言处理,信息检索,分类算法,数据分析 数据概述:该数据集包含来自多个来源的文本数据,记录了不同主题的文档或文本片段。主要特征如下: 时间跨度:数据记录的时间范围从近年到现代。... -
主题平衡数据集Topic-BalancedDataset-karimamd95
2025年4月24日 30 28 22
主题平衡数据集Topic-BalancedDataset-karimamd95 数据来源:互联网公开数据 标签:数据集,主题分类,机器学习,平衡数据,文本分析,自然语言处理,数据分析,人工智能 数据概述: 该数据集包含来自多个来源的文本数据,记录了不同主题的文本内容,旨在为机器学习和文本分类任务提供平衡的数据支持。主要特征如下:...