-
垃圾邮件识别数据集SpamEmailDataDataset-ukveteran
垃圾邮件识别数据集SpamEmailDataDataset-ukveteran 数据来源:互联网公开数据 标签:邮件分类,垃圾邮件,数据集,机器学习,自然语言处理,文本分析,网络安全,数据挖掘 数据概述: 该数据集包含来自互联网公开来源的电子邮件数据,记录了邮件的文本内容和标签(是否为垃圾邮件)。主要特征如下:... -
OOS数据集OutOfScopeDataset-fameholy
OOS数据集OutOfScopeDataset-fameholy 数据来源:互联网公开数据 标签:对话系统,数据集,自然语言处理,意图识别,机器学习,人工智能,对话分析,聊天机器人 数据概述:该数据集包含来自多个对话系统的对话记录,用于训练和测试对话系统的意图识别能力,特别关注对话中超出预设范围(Out of Scope)的用户输入。主要特征如下:... -
Mercari平台商品交易数据集MercariDataset-rohitamalnerkar
Mercari平台商品交易数据集MercariDataset-rohitamalnerkar 数据来源:互联网公开数据 标签:电子商务,商品交易,数据集,机器学习,数据分析,自然语言处理,推荐系统,商业智能 数据概述:该数据集包含来自Mercari平台的商品交易数据,记录了平台上商品的详细信息和交易情况。主要特征如下:... -
机器学习与数据科学领域文章摘要及链接数据集-Medium-AnalyticsVidhya-TowardsDataScience-pratirup
机器学习与数据科学领域文章摘要及链接数据集-Medium-AnalyticsVidhya-TowardsDataScience-pratirup 数据来源:互联网公开数据 标签:机器学习,数据科学,文章,博客,Medium,Analytics Vidhya,Towards Data Science,自然语言处理,深度学习,人工智能,数据挖掘,文本分析... -
仇恨言论分类数据集HateClassificationDataset-tushar877
仇恨言论分类数据集HateClassificationDataset-tushar877 数据来源:互联网公开数据 标签:文本分析,仇恨言论,数据集,情感分析,机器学习,自然语言处理,社会研究,网络安全 数据概述: 该数据集包含来自社交媒体平台和网络论坛的文本数据,记录了各类言论及其是否属于仇恨言论的标签。主要特征如下:... -
情绪检测社交媒体数据集ToneDetectionSocialMediaDataset-zeeshanshaik75
情绪检测社交媒体数据集ToneDetectionSocialMediaDataset-zeeshanshaik75 数据来源:互联网公开数据 标签:情绪分析,数据集,社交媒体,自然语言处理,机器学习,文本分析,情绪识别,情感计算 数据概述: 该数据集包含来自社交媒体平台的数据,记录了用户发布的内容及其对应的情绪标签。主要特征如下:... -
自然语言处理情感分析数据集NaturalLanguageProcessingSentimentAnalysisDataset-alihamadbakar
自然语言处理情感分析数据集NaturalLanguageProcessingSentimentAnalysisDataset-alihamadbakar 数据来源:互联网公开数据 标签:自然语言处理,情感分析,数据集,文本挖掘,机器学习,文本分类,人工智能,语言技术... -
阿拉伯语文本可读性与长文本摘要数据集-elhadjemechache
阿拉伯语文本可读性与长文本摘要数据集-elhadjemechache 数据来源:互联网公开数据 标签:阿拉伯语,文本可读性,文本摘要,自然语言处理,语言学,数据集,机器翻译,深度学习 数据概述: 该数据集包含阿拉伯语文本,用于研究阿拉伯语文本的可读性和文本摘要。主要特征如下: 时间跨度: 数据记录的时间范围不明确,数据本身为静态文本集合。 地理范围:... -
在线欺凌文本数据集-agadaunogwu
在线欺凌文本数据集-agadaunogwu 数据来源:互联网公开数据 标签:网络欺凌,文本数据,自然语言处理,情感分析,机器学习,社交媒体,文本分类,恶意言论 数据概述: 该数据集包含来自社交媒体平台的文本数据,记录了用户之间的在线欺凌行为。主要特征如下: 时间跨度:数据记录的时间范围为未知,但包含了近期社交媒体上的文本信息。... -
评论测试检查翻译数据集1CommentsTestCheckTranslateDataset1-yamak1906
评论测试检查翻译数据集1CommentsTestCheckTranslateDataset1-yamak1906 数据来源:互联网公开数据 标签:评论数据,数据集,翻译测试,自然语言处理,文本分析,机器学习,多语言支持,质量检查... -
GPT-3模型性能评估数据集GPT-3ModelPerformanceEvaluationDataset-utsavshek
GPT-3模型性能评估数据集GPT-3ModelPerformanceEvaluationDataset-utsavshek 数据来源:互联网公开数据 标签:自然语言处理,人工智能,数据集,机器学习,模型评估,语言模型,深度学习,算法研究 数据概述:... -
Mistral生成数据集Mistral-GeneratedDataDataset-hajarhisham
Mistral生成数据集Mistral-GeneratedDataDataset-hajarhisham 数据来源:互联网公开数据 标签:人工智能,自然语言处理,数据集,机器学习,文本生成,语言模型,深度学习,数据增强 数据概述: 该数据集由Mistral模型生成,包含大量文本数据,适用于自然语言处理和机器学习任务。主要特征如下:... -
概念嵌入数据集ConceptsEmbeddingDataset-wakeuptoreality
概念嵌入数据集ConceptsEmbeddingDataset-wakeuptoreality 数据来源:互联网公开数据 标签:概念嵌入,自然语言处理,数据集,语义理解,词向量,知识表示,机器学习,文本分析 数据概述: 该数据集包含了各种概念的嵌入表示,旨在捕捉词汇和概念之间的语义关系。主要特征如下: 时间跨度:... -
阿拉伯语文本摘要基准数据集ArabicSummarizationBenchmarkDataset-bavlygeorge
阿拉伯语文本摘要基准数据集ArabicSummarizationBenchmarkDataset-bavlygeorge 数据来源:互联网公开数据 标签:阿拉伯语,文本摘要,数据集,自然语言处理,机器学习,语言学,信息检索,翻译 数据概述: 该数据集包含来自多个来源的阿拉伯语文本数据,旨在用于文本摘要任务的评估和研究。主要特征如下:... -
电影评论预处理数据集IMDB电影评论数据集-mantri7
电影评论预处理数据集IMDB电影评论数据集-mantri7 数据来源:互联网公开数据 标签:电影评论,数据集,自然语言处理,情感分析,机器学习,文本挖掘,电影行业,评论分析 数据概述:该数据集包含来自IMDB的电影评论数据,经过预处理,适用于情感分析和文本分类任务。主要特征如下: 时间跨度:数据记录的时间范围从2000年到2017年。... -
斯坦福大型电影评论数据集StanfordLargeMovieReviewDataset-abirchodha
斯坦福大型电影评论数据集StanfordLargeMovieReviewDataset-abirchodha 数据来源:互联网公开数据 标签:电影评论,情感分析,文本分类,自然语言处理,机器学习,数据集,情感识别,NLP 数据概述: 该数据集由斯坦福大学提供,包含了来自IMDb的电影评论数据,主要用于情感分析研究。主要特征如下:... -
文档关键词提取数据集Keywords-in-DocumentsDataset-hachemsfarecotrek
文档关键词提取数据集Keywords-in-DocumentsDataset-hachemsfarecotrek 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,关键词提取,机器学习,信息检索,文本挖掘,数据科学 数据概述: 该数据集包含来自多个来源的文档数据,记录了文档及其对应的关键词信息。主要特征如下:... -
卡内基梅隆大学印地语英语混合语数据集CMUHinglishDataset-abhishek28069
卡内基梅隆大学印地语英语混合语数据集CMUHinglishDataset-abhishek28069 数据来源:互联网公开数据 标签:印地语英语混合语,数据集,自然语言处理,多语言研究,机器学习,语言分析,文本挖掘,语言技术 数据概述:... -
新闻真伪识别机器学习模型训练数据集-2023年-ronikdedhia
新闻真伪识别机器学习模型训练数据集-2023年-ronikdedhia 数据来源:互联网公开数据 标签:假新闻,真伪识别,机器学习,自然语言处理,文本分析,新闻,舆情,数据挖掘 数据概述:... -
讽刺检测数据集SarcasmDetectionDataset-wahyutisnoatmojo
讽刺检测数据集SarcasmDetectionDataset-wahyutisnoatmojo 数据来源:互联网公开数据 标签:讽刺检测,数据集,文本分析,自然语言处理,机器学习,情感分析,社交媒体,数据挖掘 数据概述: 该数据集包含来自多个社交媒体平台的数据,记录了用户发布的包含讽刺意味的文本和普通文本。主要特征如下:...