找到2,622个数据集

标签: 文本挖掘

过滤结果
  • 汉字华语处理句对数据集-yuweiiizz

    2025年4月23日   

    汉字华语处理句对数据集-yuweiiizz 数据来源:互联网公开数据 标签:汉字,华语,自然语言处理,机器翻译,语义分析,方言学,语料库,文本挖掘 数据概述: 本数据集包含传统中文与现代中文或台式中文之间的配对句子,旨在促进自然语言处理任务,特别是机器翻译和语义分析。每个数据对由一条传统中文句子及其等效的现代中文或台式中文句子组成。 数据用途概述:...
    packageimg
  • 电影评论汇总数据集2023年夏季500条电影评论-lilianli17

    2025年4月23日   

    电影评论汇总数据集2023年夏季500条电影评论-lilianli17 数据来源:互联网公开数据 标签:电影评论,数据集,自然语言处理,情感分析,文本挖掘,人工智能,电影研究,用户反馈 数据概述: 该数据集包含2023年夏季发布的500条电影评论,记录了观众对电影的评价和感受。主要特征如下: 时间跨度:数据记录的时间范围为2023年夏季。...
    packageimg
  • 恐怖主义与反恐主题推文数据集DatasetofTerrorismandAnti-terrorismTweets-shaileshkankarej2001

    2025年4月23日   

    恐怖主义与反恐主题推文数据集DatasetofTerrorismandAnti-terrorismTweets-shaileshkankarej2001 数据来源:互联网公开数据 标签:恐怖主义,反恐,推文分析,社交媒体,情感分析,文本挖掘,网络安全,机器学习 数据概述:...
    packageimg
  • 土耳其垃圾邮件数据集TurkisSpamEmailDataset-leitocan

    2025年4月23日   

    土耳其垃圾邮件数据集TurkisSpamEmailDataset-leitocan 数据来源:互联网公开数据 标签:垃圾邮件,电子邮件,文本分类,自然语言处理,机器学习,文本挖掘,土耳其语,恶意软件 数据概述: 该数据集包含来自土耳其的垃圾邮件和非垃圾邮件电子邮件数据,用于垃圾邮件检测和分类研究。主要特征如下:...
    packageimg
  • 基于BERT模型的网络情感分析数据集WebSentimentBERTR5V4Dataset-alonzorz

    2025年4月23日   

    基于BERT模型的网络情感分析数据集WebSentimentBERTR5V4Dataset-alonzorz 数据来源:互联网公开数据 标签:情感分析,自然语言处理,BERT,文本挖掘,数据集,机器学习,情感分类,社交媒体 数据概述: 该数据集包含了使用BERT模型进行情感分析的文本数据,主要用于训练和评估情感分类模型。主要特征如下:...
    packageimg
  • 推特情感分析数据集TwitterSentimentsDataset-asmikaboosarapu1234

    2025年4月23日   

    推特情感分析数据集TwitterSentimentsDataset-asmikaboosarapu1234 数据来源:互联网公开数据 标签:社交媒体,情感分析,推特,自然语言处理,文本挖掘,机器学习,舆情分析,情感识别 数据概述: 该数据集包含来自推特(Twitter)的文本数据,主要用于情感分析任务。主要特征如下:...
    packageimg
  • 比特币情绪分析数据集BitcoinSentimentAnalysisDataset-chinmayquizizz

    2025年4月23日   

    比特币情绪分析数据集BitcoinSentimentAnalysisDataset-chinmayquizizz 数据来源:互联网公开数据 标签:比特币,情绪分析,社交媒体,金融,自然语言处理,文本挖掘,加密货币,市场预测 数据概述:...
    packageimg
  • 自然语言处理示例数据集NLPSampleData-fishercht

    2025年4月23日   

    自然语言处理示例数据集NLPSampleData-fishercht 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分析,机器学习,文本挖掘,语言模型,情感分析,语料库 数据概述: 该数据集包含多种用于自然语言处理任务的示例数据,旨在帮助研究人员和开发者进行算法测试和模型训练。主要特征如下:...
    packageimg
  • 文本摘要生成数据集SESummarizationDataset-rahulshelke98

    2025年4月23日   

    文本摘要生成数据集SESummarizationDataset-rahulshelke98 数据来源:互联网公开数据 标签:文本摘要,数据集,自然语言处理,机器学习,信息检索,文本挖掘,语言学,数据科学 数据概述:该数据集包含来自Stack...
    packageimg
  • 推特情绪分析数据集TwitterSentimentAnalysisDataset-terfyworld

    2025年4月23日   

    推特情绪分析数据集TwitterSentimentAnalysisDataset-terfyworld 数据来源:互联网公开数据 标签:推特,情绪分析,情感分析,自然语言处理,社交媒体,文本挖掘,机器学习,舆情分析 数据概述: 该数据集包含了来自推特平台的大量推文数据,用于情绪分析和情感分析任务。主要特征如下: 时间跨度:...
    packageimg
  • 表格摘要数据集2020年6月16日SummaryTablesDataset-June16-2020-crispyc

    2025年4月23日   

    表格摘要数据集2020年6月16日SummaryTablesDataset-June16-2020-crispyc 数据来源:互联网公开数据 标签:表格摘要,数据集,自然语言处理,文本挖掘,机器学习,信息提取,知识图谱,人工智能 数据概述: 该数据集包含来自多个来源的表格数据及其对应的文本摘要,记录了表格内容的自动生成文本描述。主要特征如下:...
    packageimg
  • 推特情感分析训练测试数据集TwitterSentimentsTrainingTestingDataset-mehargupta98

    2025年4月23日   

    推特情感分析训练测试数据集TwitterSentimentsTrainingTestingDataset-mehargupta98 数据来源:互联网公开数据 标签:情感分析,社交媒体,数据集,自然语言处理,机器学习,文本挖掘,社交媒体分析,人工智能 数据概述:...
    packageimg
  • BBC新闻分类数据集NewsCategoryofBBCDataset-remyakarthika

    2025年4月23日   

    BBC新闻分类数据集NewsCategoryofBBCDataset-remyakarthika 数据来源:互联网公开数据 标签:新闻分类,数据集,自然语言处理,机器学习,文本分析,信息检索,媒体研究,文本挖掘 数据概述: 该数据集包含来自BBC的新闻文章数据,记录了不同类别的新闻文章内容。主要特征如下:...
    packageimg
  • 邮件分析数据集EmailAnalysisDataset-sanjayyym

    2025年4月23日   

    邮件分析数据集EmailAnalysisDataset-sanjayyym 数据来源:互联网公开数据 标签:邮件分析,文本挖掘,数据集,自然语言处理,情感分析,垃圾邮件检测,信息检索,机器学习 数据概述: 该数据集包含来自互联网的邮件数据,主要用于邮件内容分析,情感分析,垃圾邮件检测等任务。主要特征如下:...
    packageimg
  • 推特情感分析数据集TweeterSentimentDataset-ranjan6459

    2025年4月23日   

    推特情感分析数据集TweeterSentimentDataset-ranjan6459 数据来源:互联网公开数据 标签:推特,情感分析,数据集,自然语言处理,机器学习,社交媒体分析,文本挖掘,情感识别 数据概述: 该数据集包含来自推特的推文数据,记录了用户对特定主题或事件的情感表达。主要特征如下: 时间跨度:数据记录的时间范围从2019年到2021年。...
    packageimg
  • 社交媒体推文情感分析数据集SentimentsAnalysisfromTweetsDataset-tanishas2024

    2025年4月23日   

    社交媒体推文情感分析数据集SentimentsAnalysisfromTweetsDataset-tanishas2024 数据来源:互联网公开数据 标签:社交媒体,情感分析,数据集,文本挖掘,自然语言处理,机器学习,数据挖掘,情感计算 数据概述: 该数据集包含来自社交媒体平台推文的数据,记录了用户发布的推文及其对应的情感标签。主要特征如下:...
    packageimg
  • 斯里兰卡电信公司推特用户评价数据集-himashapeiris

    2025年4月23日   

    斯里兰卡电信公司推特用户评价数据集-himashapeiris 数据来源:互联网公开数据 标签:电信,推特,用户评价,情感分析,文本挖掘,社交媒体,斯里兰卡,市场调研 数据概述: 该数据集包含来自斯里兰卡电信公司推特用户的评价数据,记录了用户对电信公司服务的反馈和观点。主要特征如下: 时间跨度:数据记录的时间范围从2018年到2020年。...
    packageimg
  • BBC新闻文章分类数据集-moazeldsokyx

    2025年4月23日   

    BBC新闻文章分类数据集-moazeldsokyx 数据来源:互联网公开数据 标签:BBC,新闻,分类,体育,商业,政治,科技,娱乐,数据分析,文本挖掘 数据概述: 本数据集包含2,225篇由BBC新闻发布的新闻文章,涵盖了体育、商业、政治、科技和娱乐等五个主要类别。每篇文章都附有相应的类别标签,便于对新闻内容进行分类和分析。 数据集字段包括:...
    packageimg
  • 康奈尔电影评论数据集CornellMovieReviewDataset-mercyfausty

    2025年4月23日   

    康奈尔电影评论数据集CornellMovieReviewDataset-mercyfausty 数据来源:互联网公开数据 标签:电影评论,情感分析,数据集,自然语言处理,文本挖掘,语义理解,机器学习,情感计算 数据概述: 该数据集包含来自康奈尔大学收集的电影评论文本数据,记录了用户对电影的评价和情感倾向。主要特征如下:...
    packageimg
  • Shopee用户评论数据集-alvianardiansyah

    2025年4月23日   

    Shopee用户评论数据集-alvianardiansyah 数据来源:互联网公开数据 标签:电商平台,用户评论,情感分析,文本挖掘,机器学习,自然语言处理,市场调研,消费者行为 数据概述: 该数据集包含来自Shopee电商平台的用户评论数据,记录了用户对商品和服务的评价。主要特征如下: 时间跨度:数据记录的时间范围为不确定,取决于数据采集的范围。...
    packageimg