找到5,747个数据集

标签: 文本分析

过滤结果
  • 推特推文归档数据集TwitterArchiveDataset-oluremiogunwale

    2025年4月26日   

    推特推文归档数据集TwitterArchiveDataset-oluremiogunwale 数据来源:互联网公开数据 标签:社交媒体,推特,推文,文本分析,自然语言处理,情感分析,用户行为,数据集 数据概述: 该数据集包含来自推特(Twitter)平台的推文数据,记录了用户发布的各种推文内容。主要特征如下:...
    packageimg
  • 情感分析竞赛数据集AnalyticsVidhya-baksvijay

    2025年4月26日   

    情感分析竞赛数据集AnalyticsVidhya-baksvijay 数据来源:互联网公开数据 标签:情感分析,文本分析,自然语言处理,机器学习,数据集,情感分类,文本挖掘,NLP 数据概述: 该数据集由 Analytics Vidhya 平台提供,主要用于情感分析任务,旨在对文本数据进行情感极性判断。主要特征如下:...
    packageimg
  • 新闻分类清洗数据集NewsCategoryCleanedDataset-tamoghna96saha

    2025年4月26日   

    新闻分类清洗数据集NewsCategoryCleanedDataset-tamoghna96saha 数据来源:互联网公开数据 标签:新闻分类,数据集,文本分析,机器学习,自然语言处理,数据挖掘,信息检索,媒体研究 数据概述: 该数据集包含来自公开新闻来源的清洗后数据,记录了各类新闻文章的详细分类信息。主要特征如下:...
    packageimg
  • 尼泊尔新闻文章摘要数据集-adarsh203

    2025年4月26日   

    尼泊尔新闻文章摘要数据集-adarsh203 数据来源:互联网公开数据 标签:新闻文章,摘要,尼泊尔,自然语言处理,文本分析,机器学习,文本摘要,语料库 数据概述: 该数据集包含了尼泊尔新闻文章及其对应的摘要。主要特征如下: 时间跨度:数据记录的时间跨度不明确,取决于文章的发布时间。 地理范围:数据主要涵盖尼泊尔地区的新闻报道。...
    packageimg
  • 轻量级有毒评论数据集ToxicLiteDataset-justinluu

    2025年4月26日   

    轻量级有毒评论数据集ToxicLiteDataset-justinluu 数据来源:互联网公开数据 标签:文本分析,自然语言处理,情感分析,数据集,机器学习,有毒评论,社交媒体,文本分类 数据概述: 该数据集包含来自社交媒体平台(如Twitter,Reddit等)的评论数据,记录了评论的文本内容及其有毒性标签。主要特征如下:...
    packageimg
  • 魔戒电影数据分析数据集LordoftheRingsDataset-jaimeyao

    2025年4月26日   

    魔戒电影数据分析数据集LordoftheRingsDataset-jaimeyao 数据来源:互联网公开数据 标签:电影,数据分析,魔戒,文化研究,文本分析,人工智能,自然语言处理,影视研究 数据概述: 该数据集包含来自《魔戒》电影系列的数据,记录了该电影系列的详细信息。主要特征如下:...
    packageimg
  • 情绪方向识别数据集AngerDirectionRecognitionDataset-dianaspahieva

    2025年4月26日   

    情绪方向识别数据集AngerDirectionRecognitionDataset-dianaspahieva 数据来源:互联网公开数据 标签:情绪识别,数据集,自然语言处理,情感分析,机器学习,人工智能,文本分析,社会研究 数据概述:...
    packageimg
  • 推特标签数据集LabelTweetsDataset-corinnedavidemakia

    2025年4月26日   

    推特标签数据集LabelTweetsDataset-corinnedavidemakia 数据来源:互联网公开数据 标签:推特,社交媒体,文本分析,情感分析,自然语言处理,数据集,机器学习,舆情分析 数据概述: 该数据集包含来自推特(Twitter)的推文数据,并附带标签,用于文本分析和情感分析等任务。主要特征如下:...
    packageimg
  • 扎罗数学竞赛数据集ZaloMathCompetitionDataset-thnhphong

    2025年4月26日   

    扎罗数学竞赛数据集ZaloMathCompetitionDataset-thnhphong 数据来源:互联网公开数据 标签:数学竞赛,数据集,机器学习,自然语言处理,数学建模,问题解答,人工智能,文本分析 数据概述: 该数据集包含来自扎罗数学竞赛的题目和解答数据,用于支持数学问题解答,自然语言处理等任务。主要特征如下:...
    packageimg
  • Jigsaw偏见检测数据集JigsawBiasDetectionDataset-peijinchen

    2025年4月26日   

    Jigsaw偏见检测数据集JigsawBiasDetectionDataset-peijinchen 数据来源:互联网公开数据 标签:自然语言处理,文本分析,偏见检测,数据集,机器学习,情感分析,社会科学,人工智能 数据概述: 该数据集由 Jigsaw 团队提供,旨在支持对在线评论中偏见和有害言论的检测与分析。主要特征如下:...
    packageimg
  • 自然语言处理NLP领域数据集one-nlpDataset-dogruzvelta

    2025年4月26日   

    自然语言处理NLP领域数据集one-nlpDataset-dogruzvelta 数据来源:互联网公开数据 标签:自然语言处理,NLP,数据集,文本分析,机器学习,模型训练,语言模型,情感分析 数据概述: 该数据集包含来自NLP领域的多样化文本数据,旨在支持各种NLP任务,如文本分类,情感分析,机器翻译等。主要特征如下:...
    packageimg
  • 印地语BBC新闻数据集HindiBBCNewsDataset-renukaarch

    2025年4月26日   

    印地语BBC新闻数据集HindiBBCNewsDataset-renukaarch 数据来源:互联网公开数据 标签:新闻,印地语,数据集,文本分析,自然语言处理,机器学习,新闻分类,语言处理 数据概述: 该数据集包含来自BBC印地语新闻频道的新闻文章数据,记录了BBC印地语新闻的文本内容。主要特征如下:...
    packageimg
  • 土耳其科技新闻2022数据集TurkishTechnologyNews2022Dataset-denizhanahin

    2025年4月26日   

    土耳其科技新闻2022数据集TurkishTechnologyNews2022Dataset-denizhanahin 数据来源:互联网公开数据 标签:科技新闻,数据集,文本分析,自然语言处理,机器学习,信息提取,土耳其,新闻报道...
    packageimg
  • 立陶宛金融新闻文本数据集LithuanianFinancialNewsTextDataset-rokastrimaitis

    2025年4月26日   

    立陶宛金融新闻文本数据集LithuanianFinancialNewsTextDataset-rokastrimaitis 数据来源:互联网公开数据 标签:金融新闻,文本分析,自然语言处理,立陶宛,数据集,情感分析,信息抽取,语言模型 数据概述: 该数据集包含了来自立陶宛金融新闻的文本数据,旨在用于金融领域相关的文本分析任务。主要特征如下: 时间跨度:...
    packageimg
  • 乌尔都语字母数据集UrduAlphabetsDataset-farrukhk

    2025年4月26日   

    乌尔都语字母数据集UrduAlphabetsDataset-farrukhk 数据来源:互联网公开数据 标签:乌尔都语,字母,数据集,图像识别,机器学习,文本分析,语言学,文化研究 数据概述: 该数据集包含乌尔都语字母的图像数据,旨在用于字母识别和相关语言学研究。主要特征如下: 时间跨度:数据记录的时间范围不明确,但包含了乌尔都语字母的静态图像。...
    packageimg
  • 样本问答数据集SampledQADataDataset-hritik619916

    2025年4月26日   

    样本问答数据集SampledQADataDataset-hritik619916 数据来源:互联网公开数据 标签:问答系统,数据集,自然语言处理,机器学习,信息检索,文本分析,人工智能,数据挖掘 数据概述: 该数据集包含来自公开来源的问答对样本数据,记录了问题与对应答案的配对信息。主要特征如下:...
    packageimg
  • 西班牙语推特数据集SpanishTweetsDataset-furqanamjad

    2025年4月26日   

    西班牙语推特数据集SpanishTweetsDataset-furqanamjad 数据来源:互联网公开数据 标签:社交媒体,文本分析,情感分析,机器学习,自然语言处理,数据集,语言研究,舆情分析 数据概述: 该数据集包含来自Twitter平台的西班牙语推文数据,记录了用户发布的内容及其相关属性。主要特征如下:...
    packageimg
  • 亚马逊商品评论数据集AmazonProductReviewsDataset-sovannayak11

    2025年4月26日   

    亚马逊商品评论数据集AmazonProductReviewsDataset-sovannayak11 数据来源:互联网公开数据 标签:电子商务,商品评论,数据集,文本分析,情感分析,机器学习,消费者行为,自然语言处理 数据概述: 该数据集包含来自亚马逊网站的商品评论数据,记录了消费者对不同商品的评分和评论内容。主要特征如下:...
    packageimg
  • 海湾地区方言数据集GulfDialectsDataset-afifaalawami

    2025年4月26日   

    海湾地区方言数据集GulfDialectsDataset-afifaalawami 数据来源:互联网公开数据 标签:方言研究,语音识别,自然语言处理,中东语言,文本分析,机器学习,文化研究,语言学 数据概述:该数据集包含来自海湾地区(包括沙特阿拉伯,阿联酋,科威特,卡塔尔,巴林和也门)的方言数据,记录了不同地区方言的语音和文本样本。主要特征如下:...
    packageimg
  • 人类生成数据集HumanGeneratedDataset-manshanand

    2025年4月26日   

    人类生成数据集HumanGeneratedDataset-manshanand 数据来源:互联网公开数据 标签:人类行为,数据集,自然语言处理,社会研究,机器学习,心理学,行为分析,文本分析 数据概述:该数据集包含了通过互联网公开渠道收集的人类生成的文本数据,记录了不同场景下人类的文本生成行为。主要特征如下:...
    packageimg