-
英汉平行语料数据集English-to-HindiParallelDataset-kuldeepsingharya
英汉平行语料数据集English-to-HindiParallelDataset-kuldeepsingharya 数据来源:互联网公开数据 标签:机器翻译,自然语言处理,数据集,印地语,英语,平行语料,语言学,文本分析 数据概述: 该数据集包含了英语和印地语的平行文本数据,旨在用于机器翻译模型的训练和评估。主要特征如下:... -
垃圾邮件与非垃圾邮件分类数据集SpamvsNotSpamClassificationDataset-sajalshovon
垃圾邮件与非垃圾邮件分类数据集SpamvsNotSpamClassificationDataset-sajalshovon 数据来源:互联网公开数据 标签:电子邮件,垃圾邮件,数据集,文本分类,机器学习,自然语言处理,数据分析,信息安全 数据概述:... -
BERT情感分析数据集BERTABSADataset-darrellcr
BERT情感分析数据集BERTABSADataset-darrellcr 数据来源:互联网公开数据 标签:自然语言处理,情感分析,数据集,机器学习,文本挖掘,情感计算,人工智能,数据标注 数据概述: 该数据集包含用于BERT模型的情感分析任务的数据,记录了文本内容的情感极性。主要特征如下: 时间跨度:数据记录的时间范围不明确,主要为静态文本数据。... -
情绪词汇提取数据集EmotionalWordExtractionDataset-luoshiyong
情绪词汇提取数据集EmotionalWordExtractionDataset-luoshiyong 数据来源:互联网公开数据 标签:情绪词汇,数据集,自然语言处理,文本分析,情感计算,社会心理学,机器学习,语言学 数据概述: 该数据集包含来自多个来源的情绪词汇,记录了不同词汇对应的情绪类别及其相关特征。主要特征如下:... -
土耳其虚假新闻数据集TurkishFakeNewsDataset-atakanak
土耳其虚假新闻数据集TurkishFakeNewsDataset-atakanak 数据来源:互联网公开数据 标签:新闻分析,虚假信息,数据集,文本分类,机器学习,自然语言处理,新闻媒体,信息传播 数据概述: 该数据集包含来自土耳其公开新闻平台的数据,记录了土耳其新闻媒体中的虚假新闻内容及相关特征。主要特征如下:... -
Reddit用户评论数据集RedditUserCommentsDataset-robinlim6
Reddit用户评论数据集RedditUserCommentsDataset-robinlim6 数据来源:互联网公开数据 标签:社交媒体,评论,数据集,文本分析,情感分析,自然语言处理,用户行为,数据挖掘 数据概述: 该数据集包含来自Reddit平台的公开用户评论数据,记录了用户在不同版块和帖子下的评论内容。主要特征如下:... -
重点分析数据集EmphasesAnalysisDataset-juliocaquino
重点分析数据集EmphasesAnalysisDataset-juliocaquino 数据来源:互联网公开数据 标签:文本分析,主题建模,情感分析,数据集,自然语言处理,新闻报道,社会科学,舆情分析 数据概述: 该数据集包含来自新闻报道的文本数据,记录了不同时间段内关于特定主题的报道内容。主要特征如下:... -
钓鱼网站检测数据集PhishingWebsiteDetectionDataset-pmanimozhi
钓鱼网站检测数据集PhishingWebsiteDetectionDataset-pmanimozhi 数据来源:互联网公开数据 标签:网络安全,钓鱼网站,数据集,机器学习,恶意软件,URL分析,自然语言处理,风险评估 数据概述:... -
电影评论数据集奥本海默RottenTomatoesReviewOpennheimerMovieDataset-jihanalfi
电影评论数据集奥本海默RottenTomatoesReviewOpennheimerMovieDataset-jihanalfi 数据来源:互联网公开数据 标签:电影评论,数据集,影评分析,自然语言处理,电影研究,情感分析,媒体评论,文化研究 数据概述: 该数据集包含来自烂番茄(Rotten... -
智能手机用户反馈数据集SmartphoneUserFeedbackDataset-honinhvit
智能手机用户反馈数据集SmartphoneUserFeedbackDataset-honinhvit 数据来源:互联网公开数据 标签:智能手机,用户反馈,数据集,消费者行为,市场研究,文本分析,自然语言处理,产品改进 数据概述:该数据集包含来自智能手机用户的反馈数据,记录了用户对智能手机产品使用体验的详细评价。主要特征如下:... -
IMDB电影评论情感分析数据集IMDBMoviesReviewsSentimentAnalysisDataset-fernandoalonso12
IMDB电影评论情感分析数据集IMDBMoviesReviewsSentimentAnalysisDataset-fernandoalonso12 数据来源:互联网公开数据 标签:电影评论,情感分析,数据集,自然语言处理,机器学习,文本分类,情感计算,大数据 数据概述:... -
情感分析方面提取数据集ABS-A-AspectDataset-darrellcr
情感分析方面提取数据集ABS-A-AspectDataset-darrellcr 数据来源:互联网公开数据 标签:情感分析,方面提取,数据集,自然语言处理,机器学习,文本挖掘,数据标注,人工智能 数据概述: 该数据集专注于情感分析和方面提取任务,记录了包含多个方面的文本数据及相应的情感标签。主要特征如下:... -
通用文本摘要生成测试数据集CommonLitSummaryDummyDataDataset-shinomoriaoshi
通用文本摘要生成测试数据集CommonLitSummaryDummyDataDataset-shinomoriaoshi 数据来源:互联网公开数据 标签:文本摘要,自然语言处理,数据集,机器学习,文本生成,语言模型,人工智能,教育技术 数据概述:该数据集包含用于文本摘要生成任务的通用测试数据,记录了多个文本及其对应的摘要信息。主要特征如下:... -
主题模型分析数据集LDADataset-raditsoic
主题模型分析数据集LDADataset-raditsoic 数据来源:互联网公开数据 标签:主题模型,LDA,文本分析,自然语言处理,数据集,机器学习,文档分析,数据挖掘 数据概述: 该数据集包含用于主题模型分析的文本数据,旨在探索和发现文本集合中隐藏的主题结构。主要特征如下: 时间跨度:数据记录的时间范围不固定,取决于具体文本内容的时间属性。... -
地点提取推文数据集TweetsforLocationExtractionDataset-helendzashe
地点提取推文数据集TweetsforLocationExtractionDataset-helendzashe 数据来源:互联网公开数据 标签:推文,数据集,地点提取,自然语言处理,地理信息,社交媒体,文本分析,大数据 数据概述: 该数据集包含来自社交媒体平台的推文数据,主要用于地点信息的提取和分析。主要特征如下:... -
跨领域开放域问答数据集COSMOSQADataset-sidop21
跨领域开放域问答数据集COSMOSQADataset-sidop21 数据来源:互联网公开数据 标签:开放域问答,自然语言处理,数据集,机器学习,对话系统,信息检索,文本理解,知识图谱 数据概述: 该数据集包含来自COSMOS项目的开放域问答数据,记录了用户提出的各种问题及其对应的答案。主要特征如下:... -
Quora问答平台用户收入预测数据集QuoraQuestionswithEarningsDataset-alexgibso
Quora问答平台用户收入预测数据集QuoraQuestionswithEarningsDataset-alexgibso 数据来源:互联网公开数据 标签:问答平台,用户收入,数据集,机器学习,自然语言处理,文本分析,社交媒体,收入预测 数据概述:... -
情感分析清洗数据集CleanedSentimentAnalysisData-mustafasaleh21
情感分析清洗数据集CleanedSentimentAnalysisData-mustafasaleh21 数据来源:互联网公开数据 标签:情感分析,文本数据,自然语言处理,数据集,情感分类,机器学习,数据清洗,中文文本 数据概述: 该数据集包含经过清洗的中文情感分析数据,主要用于情感分类,文本挖掘等任务。主要特征如下: 时间跨度:... -
阿法奥罗莫语维基百科数据集AfaanOromoWikipediaDataset-beknanchemedabeki
阿法奥罗莫语维基百科数据集AfaanOromoWikipediaDataset-beknanchemedabeki 数据来源:互联网公开数据 标签:维基百科,语言资源,数据集,自然语言处理,文本挖掘,多语言,人工智能,语言学 数据概述: 该数据集包含来自阿法奥罗莫语维基百科的文本数据,记录了阿法奥罗莫语维基百科的完整内容。主要特征如下:... -
域名有效性预测数据集-harjotsaini2
域名有效性预测数据集-harjotsaini2 数据来源:互联网公开数据 标签:域名,有效性,预测,机器学习,网络安全,数据分析,自然语言处理,风险评估 数据概述: 该数据集包含用于预测域名有效性的相关数据,记录了域名注册信息,域名历史数据,以及相关网站的特征。主要特征如下: 时间跨度:数据记录的时间范围不定,取决于数据的更新频率,通常涵盖数年。...