找到5,744个数据集

标签: 文本分析

过滤结果
  • 命名实体识别数据集NER-meharihailemariam

    2025年4月26日   

    命名实体识别数据集NER-meharihailemariam 数据来源:互联网公开数据 标签:自然语言处理,命名实体识别,数据集,文本分析,机器学习,信息抽取,语言学,文本标注 数据概述: 该数据集包含用于命名实体识别(NER)任务的文本数据,记录了文本中各种命名实体的详细信息。主要特征如下: 时间跨度:...
    packageimg
  • 语法修正说服文本数据集Grammar-CorrectedPersuasiveTextDataset2023-defdet

    2025年4月26日   

    语法修正说服文本数据集Grammar-CorrectedPersuasiveTextDataset2023-defdet 数据来源:互联网公开数据 标签:语法修正,说服文本,自然语言处理,文本分析,机器学习,语言学,数据集,文本生成 数据概述: 该数据集包含经过语法修正的说服性文本数据,适用于自然语言处理和文本生成等任务。主要特征如下:...
    packageimg
  • 国际老虎日推文数据集InternationalTigerDayTweetsDataset-shaz13

    2025年4月26日   

    国际老虎日推文数据集InternationalTigerDayTweetsDataset-shaz13 数据来源:互联网公开数据 标签:社交媒体,推文,老虎,保护,动物,自然,文本分析,舆情分析 数据概述: 该数据集包含来自Twitter的推文数据,记录了与国际老虎日相关的讨论和信息。主要特征如下:...
    packageimg
  • 有害言论检测数据集ToxicSemEvalData-izuna385

    2025年4月26日   

    有害言论检测数据集ToxicSemEvalData-izuna385 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,情感分析,机器学习,有害内容检测,社交媒体,文本分析 数据概述: 该数据集包含来自 SemEval 2017 竞赛的数据,主要用于有害言论的检测与分类。主要特征如下: 时间跨度:数据记录的时间范围为 SemEval...
    packageimg
  • 土耳其TRT新闻雅安新闻数据集TRTHaberYAAMNewsDataset-denizhanahin

    2025年4月26日   

    土耳其TRT新闻雅安新闻数据集TRTHaberYAAMNewsDataset-denizhanahin 数据来源:互联网公开数据 标签:新闻,土耳其,雅安,数据集,文本分析,自然语言处理,事件报道,媒体研究 数据概述:...
    packageimg
  • 哈利波特书籍角色数据集HarryPotterBookCharacterDataset-parvanehfaraji

    2025年4月26日   

    哈利波特书籍角色数据集HarryPotterBookCharacterDataset-parvanehfaraji 数据来源:互联网公开数据 标签:文学,角色分析,数据集,哈利波特,数据挖掘,文本分析,书籍研究,角色识别 数据概述: 该数据集包含来自《哈利波特》系列书籍的角色数据,记录了书中的主要及次要角色的详细信息。主要特征如下:...
    packageimg
  • 猎头公司雇主评价竞赛数据集-aleron751

    2025年4月26日   

    猎头公司雇主评价竞赛数据集-aleron751 数据来源:互联网公开数据 标签:雇主评价,猎头,招聘,文本分析,情感分析,自然语言处理,机器学习,人力资源 数据概述: 该数据集包含来自Kaggle竞赛的猎头公司雇主评价数据,记录了用户对猎头公司的评价信息。主要特征如下: 时间跨度:数据记录的时间范围不明确,具体取决于原始数据来源。...
    packageimg
  • 在线文章标题与标题党标签数据集OnlineArticleTitlewithClickbaitLabelDataset-bantalmetal

    2025年4月26日   

    在线文章标题与标题党标签数据集OnlineArticleTitlewithClickbaitLabelDataset-bantalmetal 数据来源:互联网公开数据 标签:文本分析,数据集,自然语言处理,标题党,机器学习,内容推荐,传播学,信息处理 数据概述:...
    packageimg
  • 词语难度评估数据集DifficultiesofWordsDataset-natsumii

    2025年4月26日   

    词语难度评估数据集DifficultiesofWordsDataset-natsumii 数据来源:互联网公开数据 标签:语言学习,词汇难度,数据集,教育技术,自然语言处理,语言学,文本分析,认知科学 数据概述: 该数据集包含来自语言学研究领域的词语难度评估数据,记录了不同词语的难度等级及相关特征。主要特征如下:...
    packageimg
  • 评论分析电商商品数据集ReviewAnalysisE-commerceProductDataset-dtughdr

    2025年4月26日   

    评论分析电商商品数据集ReviewAnalysisE-commerceProductDataset-dtughdr 数据来源:互联网公开数据 标签:电商评论,数据集,自然语言处理,文本分析,机器学习,消费者行为,产品评价,数据分析 数据概述:该数据集包含来自电商平台的商品评论数据,记录了用户对产品的评价和反馈。主要特征如下:...
    packageimg
  • 辛普森第一季剧本文本数据集SeinfeldSeason1TranscriptDataset-kingsleymoore

    2025年4月26日   

    辛普森第一季剧本文本数据集SeinfeldSeason1TranscriptDataset-kingsleymoore 数据来源:互联网公开数据 标签:剧本,文本分析,数据集,自然语言处理,机器学习,电视节目,对话分析,语言模型 数据概述:该数据集包含来自美国情景喜剧《辛普森一家》第一季的剧本文本数据,记录了节目的对话和剧情内容。主要特征如下:...
    packageimg
  • 职位技能匹配数据集JobandSkillsMatchingDataset-ashenranaweera

    2025年4月26日   

    职位技能匹配数据集JobandSkillsMatchingDataset-ashenranaweera 数据来源:互联网公开数据 标签:职位,技能,数据集,自然语言处理,机器学习,文本分析,职业发展,人力资源 数据概述: 该数据集包含了职位描述和所需技能的信息,旨在用于职位与技能的匹配分析。主要特征如下:...
    packageimg
  • 网络犯罪新闻数据集CyberCrimeNewsDataSet-joel2706

    2025年4月26日   

    网络犯罪新闻数据集CyberCrimeNewsDataSet-joel2706 数据来源:互联网公开数据 标签:网络犯罪,数据集,新闻分析,网络安全,数据挖掘,文本分析,社会学,法律 数据概述:该数据集包含来自多个新闻网站的网络犯罪相关报道,记录了近年来报道的各类网络犯罪事件。主要特征如下: 时间跨度:数据记录的时间范围从2015年到2022年。...
    packageimg
  • 常见Lit阅读能力评估数据集CommonLitReadabilityAssessmentDataset-stripe

    2025年4月26日   

    常见Lit阅读能力评估数据集CommonLitReadabilityAssessmentDataset-stripe 数据来源:互联网公开数据 标签:阅读能力,教育评估,数据集,文本分析,机器学习,自然语言处理,课程设计,教育技术 数据概述: 该数据集包含来自CommonLit阅读能力评估项目的数据,记录了不同文本的阅读难度评估信息。主要特征如下:...
    packageimg
  • 标注不良词汇数据集AnnotatedBadWordsDataset-devdhk

    2025年4月26日   

    标注不良词汇数据集AnnotatedBadWordsDataset-devdhk 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,机器学习,情感分析,内容审核,数据挖掘,人工智能 数据概述:该数据集包含经过人工标注的不良词汇数据,记录了各类网络文本中常见的不良词汇及其分类。主要特征如下:...
    packageimg
  • 移动手机相关Twitter讨论数据集TwitterDatasetAboutMobilePhone-elaine1234

    2025年4月26日   

    移动手机相关Twitter讨论数据集TwitterDatasetAboutMobilePhone-elaine1234 数据来源:互联网公开数据 标签:社交媒体,移动手机,数据集,文本分析,情感分析,机器学习,消费者行为,数据挖掘 数据概述:...
    packageimg
  • 自然语言处理与灾难推文数据集NLPwithDisasterTweetsTestSetwithLabels-garfieldwong

    2025年4月26日   

    自然语言处理与灾难推文数据集NLPwithDisasterTweetsTestSetwithLabels-garfieldwong 数据来源:互联网公开数据 标签:自然语言处理,灾难推文,数据集,文本分析,机器学习,情感分析,社交媒体,数据分析 数据概述: 该数据集包含来自Twitter平台的推文数据,记录了与灾难相关的推文内容及其标签。主要特征如下:...
    packageimg
  • 民主辩论记录数据集2020年美国民主党辩论记录数据集-brandenciranni

    2025年4月26日   

    民主辩论记录数据集2020年美国民主党辩论记录数据集-brandenciranni 数据来源:互联网公开数据 标签:民主辩论,政治,数据集,文本分析,自然语言处理,政治研究,公共事务,社会科学研究 数据概述: 该数据集包含来自2020年美国民主党总统候选人辩论的完整文本记录,适用于政治研究,文本分析和自然语言处理等任务。主要特征如下:...
    packageimg
  • 天主教圣经数据集CatholicBibleDataset-shanszu

    2025年4月26日   

    天主教圣经数据集CatholicBibleDataset-shanszu 数据来源:互联网公开数据 标签:圣经,宗教,数据集,文本分析,自然语言处理,宗教研究,教育,文化研究 数据概述:该数据集包含天主教圣经的文本内容,涵盖了新约和旧约的全部书籍。主要特征如下: 时间跨度:数据记录的时间范围从公元前10世纪到公元1世纪。...
    packageimg
  • 亚马逊商品信息数据集AmazonProductsInformationDataset-ahmedcoolprojects

    2025年4月26日   

    亚马逊商品信息数据集AmazonProductsInformationDataset-ahmedcoolprojects 数据来源:互联网公开数据 标签:电商,商品信息,数据集,文本分析,机器学习,自然语言处理,市场分析,价格预测 数据概述: 该数据集包含来自亚马逊平台的商品信息,记录了各种商品的详细数据。主要特征如下:...
    packageimg