找到2,626个数据集

标签: 文本挖掘

过滤结果
  • 豆瓣电影评论数据集-ynanyue

    2025年5月28日   

    豆瓣电影评论数据集-ynanyue 数据来源:互联网公开数据 标签:电影,评论,情感分析,自然语言处理,数据集,文本挖掘,用户行为,推荐系统 数据概述: 该数据集包含来自豆瓣电影网站的电影评论数据,记录了用户对电影的评价、观影体验以及相关信息。主要特征如下: 时间跨度:数据记录的时间范围不定,取决于数据抓取的时间窗口。...
    packageimg
  • 越南新闻数据集VietNews数据集-trananhcuong

    2025年5月28日   

    越南新闻数据集VietNews数据集-trananhcuong 数据来源:互联网公开数据 标签:越南新闻, 数据集, 自然语言处理, 机器学习, 文本分析, 新闻学, 文本挖掘, 社会研究...
    packageimg
  • 能源公司电子邮件数据集EnronEmailDataset-tanweishing

    2025年5月28日   

    能源公司电子邮件数据集EnronEmailDataset-tanweishing 数据来源:互联网公开数据 标签:电子邮件数据,数据集,企业通信,数据分析,机器学习,文本挖掘,自然语言处理,商业智能 数据概述: 该数据集包含来自恩隆公司(Enron...
    packageimg
  • 文本挖掘人工智能数据集CleanedDatasetforTextMiningforAI-stefaniaconte

    2025年5月28日   

    文本挖掘人工智能数据集CleanedDatasetforTextMiningforAI-stefaniaconte 数据来源:互联网公开数据 标签:文本挖掘,数据集,人工智能,自然语言处理,机器学习,文本分析,数据清洗,信息检索 数据概述:该数据集包含经过清理和预处理的文本数据,适用于文本挖掘和人工智能领域的研究和应用。主要特征如下:...
    packageimg
  • 表情包文本情感分析数据集EmoticonsChineseSentimentAnalysisDataset-tarunsinha968

    2025年5月28日   

    表情包文本情感分析数据集EmoticonsChineseSentimentAnalysisDataset-tarunsinha968 数据来源:互联网公开数据 标签:情感分析,表情包,中文文本,数据集,自然语言处理,文本挖掘,机器学习,社交媒体 数据概述:...
    packageimg
  • CommonLit2023开放式文本阅读理解数据集-lftuwujie

    2025年5月28日   

    CommonLit2023开放式文本阅读理解数据集-lftuwujie 数据来源:互联网公开数据 标签:阅读理解,文本分析,自然语言处理,教育,数据集,机器学习,文本挖掘,语言学 数据概述: 该数据集由CommonLit平台提供,包含了来自不同年级学生的开放式文本阅读理解数据,旨在促进对阅读理解和文本分析的研究。主要特征如下:...
    packageimg
  • 推文处理流水线数据集TweetsPipelineDataset-omaressam02

    2025年5月28日   

    推文处理流水线数据集TweetsPipelineDataset-omaressam02 数据来源:互联网公开数据 标签:社交媒体,推文分析,数据集,文本挖掘,情感分析,机器学习,自然语言处理,网络舆情 数据概述: 该数据集包含来自社交媒体平台Twitter的推文数据,记录了用户发布的推文内容及相关信息。主要特征如下:...
    packageimg
  • 文本情感分类与主题识别数据集TextSentimentClassificationandTopicRecognitionDataset-thne1111

    2025年5月28日   

    文本情感分类与主题识别数据集TextSentimentClassificationandTopicRecognitionDataset-thne1111 数据来源:互联网公开数据 标签:文本情感分析, 主题分类, 多分类模型, 情感识别, 文本挖掘, 自然语言处理, 机器学习, 语料库 数据概述:...
    packageimg
  • 学术论文自然语言处理文章数据集NLPArticlesfromarXiv-org1994-2020Dataset-sagyndykbn

    2025年5月28日   

    学术论文自然语言处理文章数据集NLPArticlesfromarXiv-org1994-2020Dataset-sagyndykbn 数据来源:互联网公开数据 标签:自然语言处理,学术论文,数据集,文本分析,机器学习,学术研究,计算机科学,文本挖掘 数据概述:...
    packageimg
  • 全球新闻数据集GlobalNewsDataset-kaitohabib

    2025年5月28日   

    全球新闻数据集GlobalNewsDataset-kaitohabib 数据来源:互联网公开数据 标签:新闻,数据集,全球事务,媒体分析,文本挖掘,自然语言处理,人工智能,信息传播 数据概述: 该数据集包含来自全球各大新闻媒体的内容,记录了不同国家、地区和主题的新闻报道。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。...
    packageimg
  • 社交媒体情感分析新冠疫情推文数据集SocialMediaSentimentAnalysisCOVID-19Tweets-mlcovidresearch

    2025年5月28日   

    社交媒体情感分析新冠疫情推文数据集SocialMediaSentimentAnalysisCOVID-19Tweets-mlcovidresearch 数据来源:互联网公开数据 标签:情感分析, 社交媒体, 文本挖掘, 新冠疫情, 自然语言处理, 情绪识别, 机器学习, 语料库 数据概述:...
    packageimg
  • 基于方面的金融新闻数据集-sayanroy058

    2025年5月28日   

    基于方面的金融新闻数据集-sayanroy058 数据来源:互联网公开数据 标签:金融新闻,情感分析,方面级情感分析,自然语言处理,文本挖掘,金融市场,新闻摘要,数据集 数据概述: 该数据集包含了来自金融新闻的文章,旨在用于方面级情感分析任务。主要特征如下: 时间跨度:数据记录的时间跨度取决于新闻发布时间,具体时间范围可根据原始数据确定。...
    packageimg
  • 伊克拉研究论文数据集IQRAResearchPaperDataset-i220006hamzakhan

    2025年5月28日   

    伊克拉研究论文数据集IQRAResearchPaperDataset-i220006hamzakhan 数据来源:互联网公开数据 标签:学术研究,数据集,论文分析,自然语言处理,文本挖掘,知识发现,认知科学,教育 数据概述: 该数据集包含来自伊克拉(IQRA)的学术研究论文,主要记录了各种研究领域的研究成果。主要特征如下:...
    packageimg
  • 餐饮美食用户评价数据集RestaurantFoodUserReviews-prasannashet

    2025年5月28日   

    餐饮美食用户评价数据集RestaurantFoodUserReviews-prasannashet 数据来源:互联网公开数据 标签:餐饮, 美食, 用户评价, 情感分析, 文本挖掘, 消费者行为, 数据分析, 推荐系统 数据概述: 该数据集包含来自Zomato平台的餐饮美食用户评价数据,记录了用户对餐厅的评论、评分以及相关信息。主要特征如下:...
    packageimg
  • 商品信息聚类分析数据集ProductInformationClusterAnalysis-mesakhbesta

    2025年5月28日   

    商品信息聚类分析数据集ProductInformationClusterAnalysis-mesakhbesta 数据来源:互联网公开数据 标签:商品聚类, 零售数据, 价格分析, 商品分类, 市场分析, 文本挖掘, 机器学习, 聚类分析 数据概述:...
    packageimg
  • 虚假新闻与真实新闻文本数据集FakeandRealNewsTextDataset-sabriarbishal

    2025年5月28日   

    虚假新闻与真实新闻文本数据集FakeandRealNewsTextDataset-sabriarbishal 数据来源:互联网公开数据 标签:新闻文本, 虚假新闻, 真实新闻, 文本分类, 自然语言处理, 新闻分析, 文本挖掘, 数据标注 数据概述: 该数据集包含来自新闻网站的虚假新闻和真实新闻文本,用于训练和评估文本分类模型。主要特征如下:...
    packageimg
  • 俄语新闻文本情感分析数据集RussianNewsTextSentimentAnalysis-verabuylova

    2025年5月28日   

    俄语新闻文本情感分析数据集RussianNewsTextSentimentAnalysis-verabuylova 数据来源:互联网公开数据 标签:情感分析, 俄语, 新闻文本, 文本分类, 自然语言处理, 舆情分析, 机器学习, 文本挖掘 数据概述: 该数据集包含来自互联网的俄语新闻文本,记录了不同新闻报道的内容。主要特征如下:...
    packageimg
  • 越南语自然语言处理NLP数据集-minhhieuhuynh

    2025年5月28日   

    越南语自然语言处理NLP数据集-minhhieuhuynh 数据来源:互联网公开数据 标签:自然语言处理,越南语,文本分析,机器翻译,情感分析,数据集,语言模型,文本挖掘 数据概述: 该数据集包含来自越南语文本的数据,用于自然语言处理任务。主要特征如下: 时间跨度:数据记录的时间跨度不定,取决于具体子数据集,可能涵盖多年。...
    packageimg
  • 维基百科表格问题数据集WikiTableQuestionsDataset-kegiazabal001

    2025年5月28日   

    维基百科表格问题数据集WikiTableQuestionsDataset-kegiazabal001 数据来源:互联网公开数据 标签:自然语言处理,问答系统,数据集,表格理解,语义分析,知识图谱,机器学习,文本挖掘 数据概述: 该数据集包含来自维基百科的表格和基于这些表格提出的问题,旨在用于训练和评估问答系统在结构化数据上的表现。主要特征如下:...
    packageimg
  • 酒店用户评论评分预测数据集HotelUserReviewScorePredictionDataset-masterud

    2025年5月28日   

    酒店用户评论评分预测数据集HotelUserReviewScorePredictionDataset-masterud 数据来源:互联网公开数据 标签:酒店评论, 用户评分, 情感分析, 文本挖掘, 机器学习, 酒店行业, 旅游, 评分预测 数据概述: 该数据集包含来自酒店用户评论数据,记录了用户对酒店的评价信息和评分。主要特征如下:...
    packageimg