找到11,745个数据集

标签: 自然语言处理

过滤结果
  • 乌克兰危机英文新闻数据集UkraineCrisisEnglishNewsDataset-khemkhammohamed

    2025年4月24日   

    乌克兰危机英文新闻数据集UkraineCrisisEnglishNewsDataset-khemkhammohamed 数据来源:互联网公开数据 标签:国际关系,新闻分析,数据集,文本挖掘,机器学习,危机管理,自然语言处理,舆情分析 数据概述:...
    packageimg
  • 虚假新闻检测数据集FakeNewsDetectionDataset-masroorshah768

    2025年4月24日   

    虚假新闻检测数据集FakeNewsDetectionDataset-masroorshah768 数据来源:互联网公开数据 标签:虚假新闻,新闻检测,数据集,自然语言处理,机器学习,文本分类,信息安全,数据挖掘 数据概述: 该数据集包含来自多个新闻源的数据,记录了真实新闻与虚假新闻的特征信息。主要特征如下:...
    packageimg
  • 网络钓鱼与正常邮件分类数据集PhishingandHamEmailsDataset-mohamedouledhamed

    2025年4月24日   

    网络钓鱼与正常邮件分类数据集PhishingandHamEmailsDataset-mohamedouledhamed 数据来源:互联网公开数据 标签:网络安全,电子邮件,数据集,机器学习,自然语言处理,文本分类,垃圾邮件检测,数据挖掘 数据概述: 该数据集包含来自网络钓鱼和正常邮件的文本数据,记录了两种类型电子邮件的内容特征。主要特征如下:...
    packageimg
  • 亚马逊产品评论情感分析数据集AmazonProductReviewsSentimentAnalysisDataset-subho117

    2025年4月24日   

    亚马逊产品评论情感分析数据集AmazonProductReviewsSentimentAnalysisDataset-subho117 数据来源:互联网公开数据 标签:亚马逊,产品评论,情感分析,数据集,自然语言处理,机器学习,消费者行为,电子商务...
    packageimg
  • 音乐歌词分析数据集TheWeeknd歌词数据集-aruneembhowmick

    2025年4月24日   

    音乐歌词分析数据集TheWeeknd歌词数据集-aruneembhowmick 数据来源:互联网公开数据 标签:音乐,歌词分析,数据集,自然语言处理,情感分析,流行音乐,机器学习,文化研究 数据概述: 该数据集包含来自 The Weeknd 的豪华专辑版本歌词数据,记录了其音乐作品中的歌词详细信息。主要特征如下:...
    packageimg
  • 唐纳德特朗普推特数据集DonaldTrumpTwitterDataset-daffaalbari

    2025年4月24日   

    唐纳德特朗普推特数据集DonaldTrumpTwitterDataset-daffaalbari 数据来源:互联网公开数据 标签:推特,社交媒体,政治,数据集,文本分析,自然语言处理,社会学,政治评论 数据概述:该数据集包含唐纳德特朗普在任期内发布的推特内容,记录了他作为一个公众人物在推特平台上发表的言论。主要特征如下:...
    packageimg
  • 维基百科句子数据集WikiSentencesV2-ranjitp20

    2025年4月24日   

    维基百科句子数据集WikiSentencesV2-ranjitp20 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,语言模型,文本语料库,信息检索,机器学习,文本摘要 数据概述: 该数据集包含了来自维基百科的句子,旨在为自然语言处理任务提供大规模文本语料库。主要特征如下:...
    packageimg
  • 阿塞拜疆语词汇库数据集-slyce20

    2025年4月24日   

    阿塞拜疆语词汇库数据集-slyce20 数据来源:互联网公开数据 标签:阿塞拜疆语,词汇,语言学,文本数据,语料库,自然语言处理,词典 数据概述: 本数据集包含8.2万个阿塞拜疆语单词,构成了一个基础的词汇库。数据集涵盖了阿塞拜疆语的常用词汇,为语言研究和相关应用提供了基础数据。 数据用途概述:...
    packageimg
  • Mistral-8k困惑度评估数据集-hozaifazaki

    2025年4月24日   

    Mistral-8k困惑度评估数据集-hozaifazaki 数据来源:互联网公开数据 标签:自然语言处理,大语言模型,困惑度,评估,数据集,文本分析,机器翻译,生成模型 数据概述:该数据集包含用于评估Mistral-8k大语言模型困惑度的文本数据,旨在衡量模型对不同文本序列的理解和预测能力。主要特征如下: 时间跨度:数据记录时间范围不限,持续更新。...
    packageimg
  • 胰腺炎文献数据集PancreatitesLiteratureDataset-arminkeshavarzi

    2025年4月24日   

    胰腺炎文献数据集PancreatitesLiteratureDataset-arminkeshavarzi 数据来源:互联网公开数据 标签:医学研究,文献分析,胰腺炎,数据集,自然语言处理,学术资源,生物医学,机器学习 数据概述:...
    packageimg
  • 英语-法语机器翻译数据集English-FrenchMachineTranslationDataset-marwanmohamedmaro

    2025年4月24日   

    英语-法语机器翻译数据集English-FrenchMachineTranslationDataset-marwanmohamedmaro 数据来源:互联网公开数据 标签:机器翻译,自然语言处理,数据集,双语数据,英语,法语,文本分析,人工智能 数据概述: 该数据集包含来自公开来源的英语-...
    packageimg
  • Yelp餐饮点评情感分析数据集训练集-测试集

    2025年4月24日   

    Yelp餐饮点评情感分析数据集训练集-测试集 数据来源:互联网公开数据 标签:情感分析,文本分类,Yelp,点评,NLP,自然语言处理,机器学习,用户评论,情感极性,文本数据 数据概述:...
    packageimg
  • 商业新闻文章数据集BusinessNewsArticlesDataset-talalhassan141

    2025年4月24日   

    商业新闻文章数据集BusinessNewsArticlesDataset-talalhassan141 数据来源:互联网公开数据 标签:新闻,商业,财经,文本分析,自然语言处理,情感分析,信息检索,数据挖掘 数据概述: 该数据集包含来自各类商业新闻网站和媒体的文章,记录了全球范围内的商业和财经新闻。主要特征如下:...
    packageimg
  • 推特情感评分数据集TwitterSentimentScoresDataset-syedzabiulla

    2025年4月24日   

    推特情感评分数据集TwitterSentimentScoresDataset-syedzabiulla 数据来源:互联网公开数据 标签:社交媒体,情感分析,数据集,自然语言处理,机器学习,文本挖掘,社会研究,人工智能 数据概述:该数据集包含来自推特的文本数据,记录了用户推文的情感评分。主要特征如下:...
    packageimg
  • 拉丁语分割数据数据集LatinSplitDataDataset-nerdofdot

    2025年4月24日   

    拉丁语分割数据数据集LatinSplitDataDataset-nerdofdot 数据来源:互联网公开数据 标签:拉丁语,数据集,文本分割,语言处理,数据挖掘,历史文献,自然语言处理,语言学研究 数据概述: 该数据集包含拉丁语的文本分割数据,记录了拉丁语文本的分割和标注信息。主要特征如下:...
    packageimg
  • 说唱歌词分析数据集TupacDatasetLyricsAnalyse-leopoldofacci

    2025年4月24日   

    说唱歌词分析数据集TupacDatasetLyricsAnalyse-leopoldofacci 数据来源:互联网公开数据 标签:音乐,歌词,数据分析,文本挖掘,机器学习,自然语言处理,文化研究,说唱音乐 数据概述: 该数据集包含来自说唱歌手2Pac(图派克)的歌词数据,记录了他的音乐作品中的歌词内容。主要特征如下:...
    packageimg
  • 亚马逊手机评论数据集AmazonMobilePhonesReviewDataset-rajatagg

    2025年4月24日   

    亚马逊手机评论数据集AmazonMobilePhonesReviewDataset-rajatagg 数据来源:互联网公开数据 标签:手机,评论,情感分析,自然语言处理,数据集,用户评价,电商,机器学习 数据概述: 该数据集包含来自亚马逊平台的手机产品评论数据,记录了用户对手机产品的评价和反馈。主要特征如下:...
    packageimg
  • Solon词嵌入数据集SolonEmbeddingsDataset-ibrahimchoukrane

    2025年4月23日   

    Solon词嵌入数据集SolonEmbeddingsDataset-ibrahimchoukrane 数据来源:互联网公开数据 标签:自然语言处理,词嵌入,数据集,机器学习,文本分析,深度学习,语义理解,人工智能 数据概述: 该数据集包含Solon词嵌入模型生成的词向量数据,记录了大量词汇在多维空间中的表示。主要特征如下:...
    packageimg
  • 综合标签数据集CombinedLabelledDataset-kathank

    2025年4月23日   

    综合标签数据集CombinedLabelledDataset-kathank 数据来源:互联网公开数据 标签:综合标签,数据集,机器学习,文本分析,自然语言处理,分类,标注,数据科学 数据概述:该数据集包含来自多个来源的综合标签数据,记录了文本数据及其对应的标签,适用于机器学习和自然语言处理任务。主要特征如下:...
    packageimg
  • 标题情感分析推特数据集TitleSentimentAnalysisTwitterDataset-vasiliispe

    2025年4月23日   

    标题情感分析推特数据集TitleSentimentAnalysisTwitterDataset-vasiliispe 数据来源:互联网公开数据 标签:情感分析,数据集,推特,自然语言处理,机器学习,文本分析,社交媒体,社会研究 数据概述:该数据集包含来自推特的标题数据,记录了推特用户发布的标题及其对应的情感标签。主要特征如下:...
    packageimg