找到2,680个数据集

标签: 文本挖掘

过滤结果
  • 美国政府开放数据标题数据集CKANData-govTitlesDataset-saralafia

    2025年4月22日   

    美国政府开放数据标题数据集CKANData-govTitlesDataset-saralafia 数据来源:互联网公开数据 标签:政府数据,开放数据,数据集,标题分析,文本挖掘,数据清洗,信息检索,公共服务 数据概述:...
    packageimg
  • 专利文本挖掘与预测竞赛PTPM排行榜数据集PatentTextMiningandPredictionCompetitionLeaderboardsData...

    2025年4月22日   

    专利文本挖掘与预测竞赛PTPM排行榜数据集PatentTextMiningandPredictionCompetitionLeaderboardsDataset-fritzcremer 数据来源:互联网公开数据 标签:专利分析,文本挖掘,数据集,机器学习,自然语言处理,预测模型,人工智能,竞赛数据 数据概述:...
    packageimg
  • 微博立场分析数据集WeiboStanceAnalysisDataset-cuiximaiguidi0329

    2025年4月22日   

    微博立场分析数据集WeiboStanceAnalysisDataset-cuiximaiguidi0329 数据来源:互联网公开数据 标签:社交媒体,立场分析,数据集,文本挖掘,自然语言处理,情感分析,机器学习,数据科学 数据概述: 该数据集包含来自微博平台的数据,记录了用户对特定话题的立场表达。主要特征如下:...
    packageimg
  • Reddit社区讨论数据集RedditCommunityDiscussionDataset-dreadheadhock099

    2025年4月22日   

    Reddit社区讨论数据集RedditCommunityDiscussionDataset-dreadheadhock099 数据来源:互联网公开数据 标签:社交媒体,数据集,社区分析,文本挖掘,机器学习,情感分析,网络行为,数据分析 数据概述: 该数据集包含来自Reddit平台的社区讨论数据,记录了用户在各个主题板块的互动和交流信息。主要特征如下:...
    packageimg
  • 法律测试集LegalTestSet-nhddddz84

    2025年4月22日   

    法律测试集LegalTestSet-nhddddz84 数据来源:互联网公开数据 标签:法律,测试集,数据分析,司法研究,案例分析,机器学习,文本挖掘,法律文本 数据概述: 该数据集包含来自多个法律数据库的测试数据,记录了各类法律案例的详细信息,适用于法律文本分析,案例预测等任务。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。...
    packageimg
  • 电子病历文本数据集EHRTextDataset-dawid9632

    2025年4月22日   

    电子病历文本数据集EHRTextDataset-dawid9632 数据来源:互联网公开数据 标签:医疗健康,电子病历,自然语言处理,临床数据,数据集,文本挖掘,机器学习,人工智能 数据概述: 该数据集包含来自医疗机构的电子病历文本数据,记录了患者的临床信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。...
    packageimg
  • 恶意评论分类挑战数据集ToxicCommentsClassificationChallengeDataset-ksayantani

    2025年4月22日   

    恶意评论分类挑战数据集ToxicCommentsClassificationChallengeDataset-ksayantani 数据来源:互联网公开数据 标签:文本分类,自然语言处理,机器学习,恶意评论,情感分析,深度学习,在线社区,文本挖掘 数据概述:...
    packageimg
  • 自然语言处理情感识别数据集NLP-avSentimentIdentificationDataset-mohamedziauddin

    2025年4月22日   

    自然语言处理情感识别数据集NLP-avSentimentIdentificationDataset-mohamedziauddin 数据来源:互联网公开数据 标签:自然语言处理,情感分析,数据集,文本挖掘,机器学习,数据科学,情感识别,文本分类 数据概述: 该数据集包含来自多个来源的文本数据,记录了不同语境下的情感表达。主要特征如下:...
    packageimg
  • 网页抓取新闻数据集WebScrapedNewsDataset-ewuraamaasorassiamah

    2025年4月22日   

    网页抓取新闻数据集WebScrapedNewsDataset-ewuraamaasorassiamah 数据来源:互联网公开数据 标签:新闻数据,网页抓取,数据集,自然语言处理,文本分析,机器学习,信息提取,文本挖掘 数据概述:该数据集包含通过网页抓取技术收集的新闻数据,记录了来自多个新闻网站的新闻文章。主要特征如下:...
    packageimg
  • 泰国电影评论情感分析数据集-mussiehaileselassie

    2025年4月22日   

    泰国电影评论情感分析数据集-mussiehaileselassie 数据来源:互联网公开数据 标签:情感分析,NLP,文本挖掘,泰国电影,数据集,机器学习,自然语言处理,泰语 数据概述: 该数据集包含了来自泰国电影评论的文本数据,用于情感分析研究。主要特征如下: 时间跨度:数据记录的时间范围未知,但主要收集于电影上映期间。...
    packageimg
  • BERT情感分析数据集-endofnight17j03

    2025年4月22日   

    BERT情感分析数据集-endofnight17j03 数据来源:互联网公开数据 标签:情感分析,自然语言处理,文本数据,BERT,机器学习,情感分类,文本挖掘,NLP 数据概述: 该数据集包含用于情感分析的文本数据,旨在训练和评估基于BERT(Bidirectional Encoder Representations from...
    packageimg
  • 最终年度项目FYP论文数据集-ahtishamali05

    2025年4月22日   

    最终年度项目FYP论文数据集-ahtishamali05 数据来源:互联网公开数据 标签:毕业设计,学术论文,自然语言处理,文本分析,机器学习,文本挖掘,文献综述,学术研究 数据概述: 该数据集包含来自最终年度项目(FYP)的论文,记录了学生在不同学科领域的研究成果。主要特征如下: 时间跨度:数据记录的时间范围从2010年至今。...
    packageimg
  • 词性标注数据集POSTaggingDataset-hiuanh

    2025年4月22日   

    词性标注数据集POSTaggingDataset-hiuanh 数据来源:互联网公开数据 标签:自然语言处理,词性标注,数据集,文本分析,机器学习,语言模型,文本挖掘,计算机语言学 数据概述: 该数据集专注于词性标注任务,包含大量文本样本及其对应的词性标签。主要特征如下: 时间跨度:数据记录的时间范围未明确,但数据集内容通常反映通用语言特征。...
    packageimg
  • 阿拉伯语推特情感数据集阿拉伯语推特情感数据集-mohamedelashry74

    2025年4月22日   

    阿拉伯语推特情感数据集阿拉伯语推特情感数据集-mohamedelashry74 数据来源:互联网公开数据 标签:情感分析,社交媒体,数据集,自然语言处理,机器学习,文本挖掘,阿拉伯语,社交媒体研究 数据概述: 该数据集包含来自推特的阿拉伯语文本数据,记录了用户发布的推文及其对应的情感标签。主要特征如下:...
    packageimg
  • 恶搞之家动画剧集角色对话情感分析数据集-gokulrajkmv

    2025年4月22日   

    恶搞之家动画剧集角色对话情感分析数据集-gokulrajkmv 数据来源:互联网公开数据 标签:恶搞之家,Family Guy,动画,剧集,角色,对话,情感分析,文本挖掘,喜剧,娱乐 数据概述: 本数据集收录了美国动画喜剧《恶搞之家》(Family...
    packageimg
  • 电影评分与信息数据集2023-milindtakate

    2025年4月22日   

    电影评分与信息数据集2023-milindtakate 数据来源:互联网公开数据 标签:电影,评分,信息,机器学习,数据分析,文本挖掘,聚类,流行度,语言,投票 数据概述:...
    packageimg
  • 五十年间324首歌曲歌词文本挖掘数据集-chengjhj

    2025年4月22日   

    五十年间324首歌曲歌词文本挖掘数据集-chengjhj 数据来源:互联网公开数据 标签:歌词,文本挖掘,音乐,五十年代,歌曲,歌词分析,文本处理 数据概述:...
    packageimg
  • 推特客户服务数据集CustomerSupportonTwitterDataset-aminaslam

    2025年4月22日   

    推特客户服务数据集CustomerSupportonTwitterDataset-aminaslam 数据来源:互联网公开数据 标签:客户服务,推特,社交媒体,数据集,情感分析,文本挖掘,自然语言处理,数据分析 数据概述: 该数据集包含来自推特平台上的客户服务相关数据,记录了用户与品牌之间的互动情况。主要特征如下:...
    packageimg
  • 家得宝商品搜索关键词数据集HomeDepotSearchKeywordsDataset-riteshpatil8998

    2025年4月22日   

    家得宝商品搜索关键词数据集HomeDepotSearchKeywordsDataset-riteshpatil8998 数据来源:互联网公开数据 标签:零售业,搜索关键词,数据集,自然语言处理,文本挖掘,机器学习,消费者行为,市场分析 数据概述: 该数据集包含来自家得宝(Home...
    packageimg
  • HackerNews网站文章数据集HackerNewsArticlesDataset-farapopoola

    2025年4月22日   

    HackerNews网站文章数据集HackerNewsArticlesDataset-farapopoola 数据来源:互联网公开数据 标签:Hacker News,新闻,社交媒体,数据分析,自然语言处理,文本挖掘,机器学习,网络社区 数据概述: 该数据集包含来自Hacker News网站的文章数据,记录了Hacker...
    packageimg