找到5,741个数据集

标签: 文本分析

过滤结果
  • TensorFlow句子自动补全数据集-subho117

    2025年4月25日   

    TensorFlow句子自动补全数据集-subho117 数据来源:互联网公开数据 标签:自然语言处理,文本生成,数据集,深度学习,TensorFlow,自动补全,语言模型,文本分析 数据概述: 该数据集包含用于训练TensorFlow句子自动补全模型的文本数据,旨在实现对用户输入的句子进行智能补全。主要特征如下: 时间跨度:...
    packageimg
  • 英语-印地语混合语情感分析数据集HinglishSentimentAnalysisDataset-ankitlakra24

    2025年4月25日   

    英语-印地语混合语情感分析数据集HinglishSentimentAnalysisDataset-ankitlakra24 数据来源:互联网公开数据 标签:情感分析,Hinglish,社交媒体,自然语言处理,文本分析,机器学习,印度文化,语言学 数据概述: 该数据集包含了来自社交媒体平台的英语-...
    packageimg
  • 新冠疫情相关Reddit帖子数据集2020年2月至7月Posts-to-Coronavirus-Sub-reddit-Febrero-July-2020D...

    2025年4月25日   

    新冠疫情相关Reddit帖子数据集2020年2月至7月Posts-to-Coronavirus-Sub-reddit-Febrero-July-2020Dataset-longroad4 数据来源:互联网公开数据 标签:社交媒体,新冠疫情,数据集,文本分析,情感分析,机器学习,公共卫生,网络信息传播 数据概述:...
    packageimg
  • 虚假与真实信息识别数据集Fake-or-RealInformationIdentificationDataset-spencerholley

    2025年4月25日   

    虚假与真实信息识别数据集Fake-or-RealInformationIdentificationDataset-spencerholley 数据来源:互联网公开数据 标签:信息识别,数据集,虚假信息,真实信息,机器学习,文本分析,新闻鉴定,社会研究 数据概述:...
    packageimg
  • 文本屏蔽基准数据集RedactionBenchmarkDataset-edithram23

    2025年4月25日   

    文本屏蔽基准数据集RedactionBenchmarkDataset-edithram23 数据来源:互联网公开数据 标签:文本处理,数据集,自然语言处理,机器学习,信息提取,文本分析,隐私保护,合规性 数据概述:该数据集包含来自多个来源的文本数据,记录了文本中敏感信息的屏蔽和分类任务。主要特征如下:...
    packageimg
  • 拼字检查与验证数据集NP-65k-Spell-ExamplesDataset-amardura

    2025年4月25日   

    拼字检查与验证数据集NP-65k-Spell-ExamplesDataset-amardura 数据来源:互联网公开数据 标签:拼字检查,数据集,自然语言处理,文本分析,机器学习,语言技术,教育辅助,拼写验证 数据概述: 该数据集包含来自公开资源的大量拼字检查示例,主要用于验证和训练拼字检查模型。主要特征如下:...
    packageimg
  • 微调数据集Fine-tuningDataset-inductiveanks

    2025年4月25日   

    微调数据集Fine-tuningDataset-inductiveanks 数据来源:互联网公开数据 标签:微调,机器学习,数据集,自然语言处理,深度学习,文本分析,人工智能 数据概述:该数据集包含来自多个来源的文本数据,主要用于机器学习模型的微调任务。主要特征如下: 时间跨度:数据记录的时间范围从2018年到2022年。...
    packageimg
  • 巴以冲突社交媒体情绪分析数据集SentimentFreePalestinein-appXSVMDataset-isranurrahayu

    2025年4月25日   

    巴以冲突社交媒体情绪分析数据集SentimentFreePalestinein-appXSVMDataset-isranurrahayu 数据来源:互联网公开数据 标签:社交媒体,情绪分析,数据集,机器学习,巴以冲突,文本分析,自然语言处理,社会研究...
    packageimg
  • 微博社交媒体内容分析数据集WeiboPostsDataset-adelaideliu1999

    2025年4月25日   

    微博社交媒体内容分析数据集WeiboPostsDataset-adelaideliu1999 数据来源:互联网公开数据 标签:社交媒体,微博,文本分析,情感分析,舆情监测,机器学习,自然语言处理,数据挖掘 数据概述: 该数据集包含来自微博平台的大量用户发布的内容,记录了微博用户发布的文本,图片,视频等多媒体信息。主要特征如下:...
    packageimg
  • Tiki电商平台评论数据集TikiCommentDataset-lhhhhl

    2025年4月25日   

    Tiki电商平台评论数据集TikiCommentDataset-lhhhhl 数据来源:互联网公开数据 标签:电商,评论数据,文本分析,情感分析,自然语言处理,用户行为,产品评价,机器学习 数据概述: 该数据集包含来自越南电商平台Tiki的商品评论数据,记录了用户对商品的使用评价。主要特征如下: 时间跨度: 数据记录的时间范围为2017年至2022年。...
    packageimg
  • 新冠疫情推特文本数据集COVID-19TwitterTextDataset-kinggeogt

    2025年4月25日   

    新冠疫情推特文本数据集COVID-19TwitterTextDataset-kinggeogt 数据来源:互联网公开数据 标签:新冠疫情,推特,社交媒体,文本分析,自然语言处理,情感分析,公共卫生,数据集 数据概述: 该数据集包含来自推特(Twitter)的公开推文数据,记录了与新冠疫情相关的大量文本信息。主要特征如下:...
    packageimg
  • 可口可乐产品问答数据集Coca-ColaProductQuestionAnsweringDataset-vedantpalit

    2025年4月25日   

    可口可乐产品问答数据集Coca-ColaProductQuestionAnsweringDataset-vedantpalit 数据来源:互联网公开数据 标签:可口可乐,问答,自然语言处理,数据集,文本分析,情感分析,机器学习,产品信息 数据概述: 该数据集包含可口可乐产品的相关问答数据,旨在为自然语言处理任务提供训练和测试资源。主要特征如下:...
    packageimg
  • 新冠疫情虚假新闻数据集COVID-19FakeNewsDataset-invalizare

    2025年4月25日   

    新冠疫情虚假新闻数据集COVID-19FakeNewsDataset-invalizare 数据来源:互联网公开数据 标签:新冠疫情,虚假新闻,数据集,文本分析,自然语言处理,谣言检测,舆情分析,社交媒体 数据概述: 该数据集收录了关于新冠疫情的虚假新闻和真实新闻,旨在用于虚假信息检测和分析。主要特征如下:...
    packageimg
  • 词汇意义消歧WordSenseDisambiguation数据集Word-Sense-Disambiguation-WSD-Dataset-with-Se...

    2025年4月25日   

    词汇意义消歧WordSenseDisambiguation数据集Word-Sense-Disambiguation-WSD-Dataset-with-Senses-shreyswan 数据来源:互联网公开数据 标签:自然语言处理,词汇意义消歧,数据集,语言建模,文本分析,语义理解,机器学习,语言学 数据概述:...
    packageimg
  • 摩洛哥新闻文章数据集MorrocanNewsArticlesDataset-sihamemouanid

    2025年4月25日   

    摩洛哥新闻文章数据集MorrocanNewsArticlesDataset-sihamemouanid 数据来源:互联网公开数据 标签:新闻,摩洛哥,文本分析,自然语言处理,数据集,阿拉伯语,法语,情感分析,舆情分析 数据概述: 该数据集包含来自摩洛哥新闻网站的文章数据,记录了摩洛哥新闻媒体发布的文章内容。主要特征如下:...
    packageimg
  • 微软新闻数据集1999-2023MSFTNewsDataset1999-2023-abhindeves

    2025年4月25日   

    微软新闻数据集1999-2023MSFTNewsDataset1999-2023-abhindeves 数据来源:互联网公开数据 标签:新闻数据,数据集,文本分析,机器学习,自然语言处理,数据分析,信息提取,时间序列 数据概述: 该数据集包含来自微软公司官方新闻发布的数据,记录了微软公司自1999年至2023年间的新闻内容。主要特征如下:...
    packageimg
  • 自然语言处理作业2-3数据集NLPAssignment2-3Dataset-dheerajkr1a1a

    2025年4月25日   

    自然语言处理作业2-3数据集NLPAssignment2-3Dataset-dheerajkr1a1a 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分析,机器学习,情感分析,语言模型,学术资源,文本分类 数据概述: 该数据集来自自然语言处理课程作业2-3,记录了用于文本分类和情感分析任务的文本数据。主要特征如下:...
    packageimg
  • Kaggle混合媒体数据分析数据集KaggleMixedMediaDataAnalysisDataset-jimhaines

    2025年4月25日   

    Kaggle混合媒体数据分析数据集KaggleMixedMediaDataAnalysisDataset-jimhaines 数据来源:互联网公开数据 标签:混合媒体,数据分析,数据集,机器学习,图像处理,文本分析,时间序列,商业智能 数据概述:...
    packageimg
  • 推特灾难事件文本数据集PreprocessedDisasterTweetsDataset-priyanagda

    2025年4月25日   

    推特灾难事件文本数据集PreprocessedDisasterTweetsDataset-priyanagda 数据来源:互联网公开数据 标签:推特,灾难事件,文本分析,自然语言处理,机器学习,情感分析,数据挖掘,社会科学 数据概述: 该数据集包含来自推特平台的公开数据,记录了与灾难事件相关的推文信息。主要特征如下:...
    packageimg
  • TED演讲内容数据集TEDTalksMainCSVDataset-nafisaalianika

    2025年4月25日   

    TED演讲内容数据集TEDTalksMainCSVDataset-nafisaalianika 数据来源:互联网公开数据 标签:TED演讲,数据集,文本分析,语言学习,机器学习,自然语言处理,教育,心理学 数据概述: 该数据集包含来自TED官网的主要演讲内容数据,记录了 TED 演讲的详细信息和文本内容。主要特征如下:...
    packageimg