-
用户对话情感分析数据集UserDialogueSentimentAnalysis-aeryss
用户对话情感分析数据集UserDialogueSentimentAnalysis-aeryss 数据来源:互联网公开数据 标签:情感分析, 对话数据, 自然语言处理, 文本分类, 客户服务, 满意度, 机器学习, 数据标注 数据概述:... -
英语到印地语翻译数据集English-to-HindiTranslateDataset-saediscrazy
英语到印地语翻译数据集English-to-HindiTranslateDataset-saediscrazy 数据来源:互联网公开数据 标签:机器翻译,自然语言处理,数据集,印地语,英语,文本翻译,语言模型,多语言 数据概述: 该数据集包含英语到印地语的翻译文本对,旨在用于机器翻译模型的训练和评估。主要特征如下: 时间跨度:... -
有毒评论数据集ToxicCommentDataset-rohanrkalbag
有毒评论数据集ToxicCommentDataset-rohanrkalbag 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,情感分析,机器学习,文本挖掘,社交网络,内容审核 数据概述: 该数据集包含来自互联网公开平台的有毒评论数据,记录了各类网络评论的文本内容及其标注。主要特征如下:... -
放射科图像问答数据集VQA-RADDataset-sonnlp
放射科图像问答数据集VQA-RADDataset-sonnlp 数据来源:互联网公开数据 标签:医学影像,问答,数据集,放射学,自然语言处理,计算机视觉,图像识别,人工智能 数据概述: 该数据集包含来自放射科图像和相关问题的配对数据,用于训练和评估医学影像问答(VQA)模型。主要特征如下:... -
社交媒体文本讽刺识别数据集SocialMediaTextSarcasmDetection-wenxindong
社交媒体文本讽刺识别数据集SocialMediaTextSarcasmDetection-wenxindong 数据来源:互联网公开数据 标签:文本分类, 情感分析, 讽刺检测, 自然语言处理, 机器学习, 社交媒体, 数据标注, 语料分析 数据概述: 该数据集包含来自社交媒体平台的文本数据,用于训练和评估讽刺言论的检测模型。主要特征如下:... -
维基百科摘要数据集Wiki-SumDataset-sandeep16064
维基百科摘要数据集Wiki-SumDataset-sandeep16064 数据来源:互联网公开数据 标签:文本摘要,自然语言处理,数据集,机器学习,信息检索,文本分析,知识图谱,语言模型 数据概述: 该数据集包含来自维基百科的文本及对应的摘要数据,记录了维基百科条目的详细内容和自动生成的摘要信息。主要特征如下:... -
语言模型多轮对话质量评估数据集LanguageModelMulti-turnDialogueQualityEvaluation-mbaiornommbaihodji
语言模型多轮对话质量评估数据集LanguageModelMulti-turnDialogueQualityEvaluation-mbaiornommbaihodji 数据来源:互联网公开数据 标签:多轮对话, 语言模型, 对话质量, 文本生成, 语义理解, 评估, 机器学习, 自然语言处理 数据概述:... -
虚假新闻与真实新闻数据集FakeNewsandTrueNewsDataset-umarfarooq45
虚假新闻与真实新闻数据集FakeNewsandTrueNewsDataset-umarfarooq45 数据来源:互联网公开数据 标签:新闻分析,数据集,文本挖掘,机器学习,信息传播,自然语言处理,虚假信息,新闻分类 数据概述: 该数据集包含来自公开渠道的新闻文章数据,记录了真实新闻与虚假新闻的内容和特征。主要特征如下:... -
OCR文字识别训练数据集OCRCRNNTrainWordSplit250-600Dataset-aditya08
OCR文字识别训练数据集OCRCRNNTrainWordSplit250-600Dataset-aditya08 数据来源:互联网公开数据 标签:光学字符识别,文字识别,数据集,深度学习,计算机视觉,自然语言处理,图像处理,机器学习 数据概述:... -
MBTI类型推文数据集MBTITweetsDataset-vhu894
MBTI类型推文数据集MBTITweetsDataset-vhu894 数据来源:互联网公开数据 标签:MBTI人格类型,推文分析,自然语言处理,社交媒体,心理学,文本挖掘,机器学习,数据科学 数据概述:该数据集包含来自Twitter的推文数据,记录了不同MBTI人格类型用户的推文内容。主要特征如下:... -
Reddit用户行为与帖子互动数据集RedditUserBehaviorandPostInteractionDataset-quangnguyen711
Reddit用户行为与帖子互动数据集RedditUserBehaviorandPostInteractionDataset-quangnguyen711 数据来源:互联网公开数据 标签:社交媒体,Reddit,用户行为,帖子互动,自然语言处理,数据分析,文本挖掘,机器学习 数据概述: 该数据集包含来自 Reddit 平台的公开数据,记录了用户在... -
招聘信息分析数据集JobRecruitmentInformationAnalysis-rajarshivaibhav
招聘信息分析数据集JobRecruitmentInformationAnalysis-rajarshivaibhav 数据来源:互联网公开数据 标签:招聘信息, 职位分析, 技能需求, 行业洞察, 文本挖掘, 自然语言处理, 市场调研, 职业发展 数据概述:... -
社交媒体抑郁症检测数据集SWC-WANGDepressionDetectionDataset-mihailchirobocea
社交媒体抑郁症检测数据集SWC-WANGDepressionDetectionDataset-mihailchirobocea 数据来源:互联网公开数据 标签:抑郁症,社交媒体,文本分析,自然语言处理,情感分析,机器学习,心理健康,数据集 数据概述: 该数据集包含来自社交媒体平台的数据,用于抑郁症检测研究。主要特征如下:... -
马拉提语文档数据集MarathiDocumentsDataset-ashwanillkagechaad
马拉提语文档数据集MarathiDocumentsDataset-ashwanillkagechaad 数据来源:互联网公开数据 标签:马拉提语,文档数据集,自然语言处理,机器学习,文本分析,印度文化,学术资源,语言学 数据概述: 该数据集包含来自多个来源的马拉提语文档,记录了马拉提语的文本数据,适用于自然语言处理、文本分析等任务。主要特征如下:... -
抑郁症相关文本情感分析数据集Depression-relatedTextSentimentAnalysis-siddhantdrk
抑郁症相关文本情感分析数据集Depression-relatedTextSentimentAnalysis-siddhantdrk 数据来源:互联网公开数据 标签:抑郁症, 情感分析, 文本分类, 心理健康, 自然语言处理, 社交媒体, 情绪识别, 数据挖掘 数据概述:... -
文本分类邮件数据集TextClassificationEmailDataset-kaushal2896
文本分类邮件数据集TextClassificationEmailDataset-kaushal2896 数据来源:互联网公开数据 标签:文本分类, 邮件, 自然语言处理, 机器学习, 语料库, 预处理, 情感分析, 多分类 数据概述: 该数据集包含来自不同新闻组的邮件文本数据,用于文本分类任务。主要特征如下:... -
人类文本数据集HumanTextDataset-errordebug
人类文本数据集HumanTextDataset-errordebug 数据来源:互联网公开数据 标签:文本数据,自然语言处理,数据集,机器学习,情感分析,文本分类,语言模型,人工智能 数据概述: 该数据集包含来自互联网公开渠道的人类生成文本数据,记录了各类文本内容的详细信息。主要特征如下: 时间跨度:数据记录的时间范围从近年到现代。... -
虚假新闻检测训练数据集FakeNewsDetectionTrainingDataset-shyamgsundhar
虚假新闻检测训练数据集FakeNewsDetectionTrainingDataset-shyamgsundhar 数据来源:互联网公开数据 标签:虚假新闻,数据集,文本分析,自然语言处理,机器学习,信息检索,新闻报道,舆情分析 数据概述: 该数据集包含了大量用于虚假新闻检测的文本数据,旨在帮助研究人员和开发者构建和评估虚假新闻检测模型。主要特征如下:... -
文本预处理语料库TextPreprocessingCorpus-dinhnhattruong
文本预处理语料库TextPreprocessingCorpus-dinhnhattruong 数据来源:互联网公开数据 标签:文本处理,数据集,自然语言处理,机器学习,文本挖掘,数据清洗,语言学,信息检索 数据概述:该数据集包含了来自互联网和公开出版物的文本数据,适用于文本预处理、自然语言处理等任务。主要特征如下:... -
推特文本清洗与展开缩写数据集CleanTweetswithExpandedContractionsDataset-mgmdif
推特文本清洗与展开缩写数据集CleanTweetswithExpandedContractionsDataset-mgmdif 数据来源:互联网公开数据 标签:推特,文本数据,数据清洗,自然语言处理,缩写展开,情感分析,机器学习,社交媒体 数据概述: 该数据集包含从推特(Twitter)平台收集的文本数据,并进行了清洗和缩写展开处理。主要特征如下:...