-
信息检索与机器阅读理解数据集MSMARCODataset-parthplc
信息检索与机器阅读理解数据集MSMARCODataset-parthplc 数据来源:互联网公开数据 标签:信息检索,机器阅读理解,数据集,自然语言处理,搜索技术,人工智能,深度学习,文本分类 数据概述: 该数据集由微软(Microsoft)发布,主要记录了面向大规模信息检索和机器阅读理解任务的数据。主要特征如下:... -
Jigsaw毒性评论分类训练数据集JigsawToxicCommentClassificationTrainDataset-zaheenchoudhry
Jigsaw毒性评论分类训练数据集JigsawToxicCommentClassificationTrainDataset-zaheenchoudhry 数据来源:互联网公开数据 标签:评论分析,数据集,机器学习,自然语言处理,文本分类,社会分析,毒性评论,数据预处理 数据概述:该数据集由 Jigsaw... -
文本情感分类新闻数据集TextSentimentClassificationNewsDataset-premsaikumar
文本情感分类新闻数据集TextSentimentClassificationNewsDataset-premsaikumar 数据来源:互联网公开数据 标签:情感分析, 文本分类, 新闻, 自然语言处理, 深度学习, 语料库, 情感标签, 预训练 数据概述: 该数据集包含来自新闻报道的文本数据,记录了新闻文章的描述信息及其对应的情感类别。主要特征如下:... -
跨语言文本理解多任务数据集Cross-lingualTextUnderstandingMulti-taskDataset-gautamgupta007
跨语言文本理解多任务数据集Cross-lingualTextUnderstandingMulti-taskDataset-gautamgupta007 数据来源:互联网公开数据 标签:跨语言, 文本理解, 多任务学习, 机器翻译, 文本分类, 问答系统, 数据集, 自然语言处理 数据概述:... -
新闻文本分类数据集NewsTextClassificationDataset-brij1823
新闻文本分类数据集NewsTextClassificationDataset-brij1823 数据来源:互联网公开数据 标签:新闻文本, 文本分类, 标题分析, 自然语言处理, 新闻内容, 时间序列, 机器学习, 语料库 数据概述: 该数据集包含来自新闻媒体的文本数据,记录了新闻标题及其对应的类别。主要特征如下:... -
新闻文章文本情感分析数据集NewsArticleTextSentimentAnalysis-vangphamhuu
新闻文章文本情感分析数据集NewsArticleTextSentimentAnalysis-vangphamhuu 数据来源:互联网公开数据 标签:新闻文章, 情感分析, 文本分类, 自然语言处理, 情感极性, 机器学习, 数据标注, 舆情分析 数据概述: 该数据集包含来自新闻网站的文章文本数据,记录了新闻文章的内容,可用于情感分析任务。主要特征如下:... -
儿童文学作品文本分析数据集Children-sLiteratureTextAnalysis-mamainwuxi
儿童文学作品文本分析数据集Children-sLiteratureTextAnalysis-mamainwuxi 数据来源:互联网公开数据 标签:儿童文学, 文本分析, 情感分析, 图神经网络, 文本分类, 机器学习, 自然语言处理, 叙事结构 数据概述:... -
旅游景点评论情感分析数据集TourismSentimentAnalysisofReviews-sourav5720
旅游景点评论情感分析数据集TourismSentimentAnalysisofReviews-sourav5720 数据来源:互联网公开数据 标签:情感分析, 旅游, 评论数据, 自然语言处理, 文本分类, 景点评价, 机器学习, 数据标注 数据概述: 该数据集包含来自旅游景点评论数据,记录了用户对不同景点的评价文本及其对应的情感极性。主要特征如下:... -
教育内容主题相关性文本数据集EducationalContentTopicRelevanceTextDataset-millerrfu
教育内容主题相关性文本数据集EducationalContentTopicRelevanceTextDataset-millerrfu 数据来源:互联网公开数据 标签:文本分类, 教育, 主题相关性, 自然语言处理, 机器学习, 知识图谱, 语料库, 内容理解 数据概述:... -
问答对重复性判断数据集QuestionPairDuplicateDetectionDataset-aphelionr
问答对重复性判断数据集QuestionPairDuplicateDetectionDataset-aphelionr 数据来源:互联网公开数据 标签:自然语言处理, 文本匹配, 语义相似度, 问答系统, 文本分类, 机器学习, 数据增强, 深度学习 数据概述:... -
文本情感分析数据集TextSentimentAnalysis-zhihaoliang2
文本情感分析数据集TextSentimentAnalysis-zhihaoliang2 数据来源:互联网公开数据 标签:情感分析, 文本分类, 情感极性, 机器学习, 深度学习, 自然语言处理, 情感标注, 文本向量化 数据概述: 该数据集包含用于文本情感分析任务的结构化数据,主要用于训练和评估文本情感分类模型。主要特征如下:... -
社交平台评论毒性评估预测数据集SocialPlatformCommentToxicityPrediction-hhstrand
社交平台评论毒性评估预测数据集SocialPlatformCommentToxicityPrediction-hhstrand 数据来源:互联网公开数据 标签: 毒性检测, 文本分类, 机器学习, 情感分析, 自然语言处理, 深度学习, 评论分析, 模型预测 数据概述: 该数据集包含来自社交平台评论的预测结果,用于评估评论的毒性程度。主要特征如下:... -
文档页面分类数据集DocumentPageClassificationDataset-lucigugler
文档页面分类数据集DocumentPageClassificationDataset-lucigugler 数据来源:互联网公开数据 标签:文本分类, 页面识别, 文档分析, 机器学习, 图像处理, 数据标注, 结构化数据, HDF5 数据概述: 该数据集包含用于文档页面分类的数据,记录了文档页面及其对应的分类标签。主要特征如下:... -
事实核查声明文本数据集Fact-checkingClaimTextDataset-ritvik916
事实核查声明文本数据集Fact-checkingClaimTextDataset-ritvik916 数据来源:互联网公开数据 标签:事实核查, 声明文本, 文本分类, 政治声明, 真伪判断, 自然语言处理, 信息抽取, 数据标注 数据概述: 该数据集包含来自事实核查网站的数据,记录了用于事实核查的声明文本。主要特征如下:... -
虚假信息与讽刺性新闻数据集MisinformationandSatireNewsDataset-hrithikmajumdar
虚假信息与讽刺性新闻数据集MisinformationandSatireNewsDataset-hrithikmajumdar 数据来源:互联网公开数据 标签:虚假信息,新闻分析,数据集,文本分类,自然语言处理,媒体研究,机器学习,内容审核 数据概述:... -
心理健康论坛文本情感分析数据集MentalHealthForumTextSentimentAnalysis-mohammad4tef
心理健康论坛文本情感分析数据集MentalHealthForumTextSentimentAnalysis-mohammad4tef 数据来源:互联网公开数据 标签:心理健康, 情感分析, 文本分类, 社交媒体, BPD, 论坛数据, 自然语言处理, 情感识别 数据概述:... -
新闻媒体文章内容分析数据集NewsMediaArticlesContentAnalysis-somaadithya
新闻媒体文章内容分析数据集NewsMediaArticlesContentAnalysis-somaadithya 数据来源:互联网公开数据 标签:新闻媒体, 内容分析, 文本挖掘, 自然语言处理, 舆情分析, 情感分析, 文本分类, 数据集 数据概述: 该数据集包含来自Medium平台的文章数据,记录了文章的标题、正文等内容。主要特征如下:... -
多语言虚假新闻检测数据集MultilingualFakeNewsDetectionDataset-begonil
多语言虚假新闻检测数据集MultilingualFakeNewsDetectionDataset-begonil 数据来源:互联网公开数据 标签:虚假新闻,数据集,多语言,自然语言处理,文本分类,机器学习,新闻分析,信息传播 数据概述: 该数据集包含来自多个国家和地区的新闻文章,记录了不同语言环境下的新闻真实性分类信息。主要特征如下:... -
交通事故与情绪分析文本数据集TrafficAccident-EmotionAnalysisTextDataset-hamadlouay
交通事故与情绪分析文本数据集TrafficAccident-EmotionAnalysisTextDataset-hamadlouay 数据来源:互联网公开数据 标签:交通事故, 情绪分析, 文本分类, 自然语言处理, 情感识别, 交通安全, 文本挖掘, 数据标注 数据概述:... -
音乐歌词流派分析数据集MusicLyricsGenreAnalysis-paltiramya
音乐歌词流派分析数据集MusicLyricsGenreAnalysis-paltiramya 数据来源:互联网公开数据 标签:歌词分析, 音乐流派, 自然语言处理, 文本分类, 流行音乐, 嘻哈音乐, 摇滚音乐, 爵士乐 数据概述: 该数据集包含来自互联网的音乐歌词数据,涵盖了多种音乐流派,旨在为音乐分析和自然语言处理研究提供支持。主要特征如下:...