找到11,752个数据集

标签: 自然语言处理

过滤结果
  • 自然语言处理项目数据集NLPProjectDataset-chiraayupravin

    2025年4月24日   

    自然语言处理项目数据集NLPProjectDataset-chiraayupravin 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分析,机器学习,语言模型,人工智能,数据挖掘,文本分类 数据概述: 该数据集为自然语言处理项目的一部分,主要记录了用于文本分析,语言模型训练等任务的数据。主要特征如下:...
    packageimg
  • HackerEarth零样本数据科学挑战赛数据集Zero-ShotDataScienceChallengeDataset-mark13juna

    2025年4月24日   

    HackerEarth零样本数据科学挑战赛数据集Zero-ShotDataScienceChallengeDataset-mark13juna 数据来源:互联网公开数据 标签:数据科学,零样本学习,文本分类,机器学习,自然语言处理,竞赛数据集,HackerEarth,NLP 数据概述:...
    packageimg
  • 英语-越南语双语平行文本数据集English-VietnameseParallelTextDataset-flightstar

    2025年4月24日   

    英语-越南语双语平行文本数据集English-VietnameseParallelTextDataset-flightstar 数据来源:互联网公开数据 标签:语言翻译,平行文本,数据集,自然语言处理,机器学习,双语研究,人工智能,语言技术 数据概述: 该数据集包含英语和越南语的双语平行文本,记录了两种语言之间的对应翻译关系。主要特征如下:...
    packageimg
  • Reddit社区评论文本与参数数据集-takeshiiijima

    2025年4月24日   

    Reddit社区评论文本与参数数据集-takeshiiijima 数据来源:互联网公开数据 标签:社交媒体,Reddit,评论,文本分析,自然语言处理,情感分析,机器学习,舆情分析 数据概述: 该数据集包含来自Reddit社区的评论数据,并附有相应的文本参数。主要特征如下: 时间跨度:数据记录的时间跨度未知,取决于Reddit公开数据的获取时间范围。...
    packageimg
  • JinaAI文本测试数据集JinaAITextTestDataset-xinrant

    2025年4月24日   

    JinaAI文本测试数据集JinaAITextTestDataset-xinrant 数据来源:互联网公开数据 标签:文本数据,数据集,自然语言处理,测试集,机器学习,Jina AI,NLP,评估 数据概述: 该数据集由Jina AI提供,用于测试和评估自然语言处理(NLP)模型和相关技术。主要特征如下:...
    packageimg
  • 缅甸新闻语料数据集MizoNews14kDataset-robzchhangte

    2025年4月24日   

    缅甸新闻语料数据集MizoNews14kDataset-robzchhangte 数据来源:互联网公开数据 标签:新闻数据,自然语言处理,文本分类,数据集,机器学习,新闻分析,缅甸语,语言技术 数据概述: 该数据集包含来自缅甸的新闻文本数据,记录了缅甸新闻媒体发布的各类新闻内容。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。...
    packageimg
  • 自然语言处理词袋模型提交数据集NLPBagofWordsSubmissionDataset-yashasgarg

    2025年4月24日   

    自然语言处理词袋模型提交数据集NLPBagofWordsSubmissionDataset-yashasgarg 数据来源:互联网公开数据 标签:自然语言处理,词袋模型,数据集,文本分类,机器学习,文本分析,数据挖掘,信息检索 数据概述: 该数据集包含自然语言处理中词袋模型的提交数据,记录了文本分类,关键词提取等任务的样本和标签。主要特征如下:...
    packageimg
  • 统计学专业毕业论文数据集数据集-tirtainovan

    2025年4月24日   

    统计学专业毕业论文数据集数据集-tirtainovan 数据来源:互联网公开数据 标签:统计学,毕业论文,数据集,文本分析,学术研究,自然语言处理,论文写作,学术资源 数据概述: 该数据集包含统计学专业毕业论文的文本数据,旨在为学术研究和数据分析提供支持。主要特征如下: 时间跨度:数据记录的时间范围涵盖了近年来统计学专业毕业论文。...
    packageimg
  • 新冠疫情问答数据集COVID-19QuestionAnsweringDataset-rockerritesh

    2025年4月24日   

    新冠疫情问答数据集COVID-19QuestionAnsweringDataset-rockerritesh 数据来源:互联网公开数据 标签:公共卫生,数据集,问答系统,自然语言处理,机器学习,疫情研究,人工智能,医疗信息 数据概述: 该数据集包含来自全球范围内关于新冠疫情的问答数据,记录了公众和专业人士就疫情相关问题与答案的详细信息。主要特征如下:...
    packageimg
  • 自然语言处理NLP最终项目数据集-prasadmagdum

    2025年4月24日   

    自然语言处理NLP最终项目数据集-prasadmagdum 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,机器学习,情感分析,文本分类,信息提取,深度学习 数据概述: 该数据集是为自然语言处理最终项目设计的,包含了多种文本数据,用于训练和评估各种NLP模型。主要特征如下: 时间跨度:数据记录的时间范围不固定,取决于各个子数据集的来源。...
    packageimg
  • 阿塞拜疆语情感分析数据集SentimentDatasetforAzerbaijaniLanguage-natigmamishov

    2025年4月24日   

    阿塞拜疆语情感分析数据集SentimentDatasetforAzerbaijaniLanguage-natigmamishov 数据来源:互联网公开数据 标签:情感分析,数据集,自然语言处理,阿塞拜疆语,文本挖掘,机器学习,社交媒体分析,语言学 数据概述:...
    packageimg
  • 土耳其健康新闻数据集TurkishHealthNewsDataset-denizhanahin

    2025年4月24日   

    土耳其健康新闻数据集TurkishHealthNewsDataset-denizhanahin 数据来源:互联网公开数据 标签:新闻,健康,数据集,土耳其,文本分析,自然语言处理,医疗信息,机器学习 数据概述: 该数据集包含来自土耳其公开渠道的健康相关新闻文章,记录了与健康,医疗,公共卫生等主题相关的新闻报道。主要特征如下:...
    packageimg
  • 新闻摘要数据集NewsSummaryDataset-usmannwaheed

    2025年4月24日   

    新闻摘要数据集NewsSummaryDataset-usmannwaheed 数据来源:互联网公开数据 标签:新闻,摘要,数据集,文本分析,自然语言处理,机器学习,信息提取,文本生成 数据概述: 该数据集包含来自互联网的新闻文章及其对应的摘要,记录了新闻内容的关键信息。主要特征如下: 时间跨度:数据记录的时间范围从2013年到2017年。...
    packageimg
  • 反讽文本嵌入数据集IronyEmbedsDataset-yanivramuk

    2025年4月24日   

    反讽文本嵌入数据集IronyEmbedsDataset-yanivramuk 数据来源:互联网公开数据 标签:自然语言处理,文本分析,情感分析,机器学习,数据集,语义理解,情感识别,深度学习 数据概述: 该数据集包含来自社交媒体和在线评论的反讽文本数据,记录了包含反讽表达的文本及其对应的嵌入表示。主要特征如下:...
    packageimg
  • 灾难推文清理数据集NLPDisasterTweetsCleanedDataset-garcke

    2025年4月24日   

    灾难推文清理数据集NLPDisasterTweetsCleanedDataset-garcke 数据来源:互联网公开数据 标签:自然语言处理,灾难推文,数据集,文本清理,社交媒体,灾害监测,情感分析,机器学习 数据概述:该数据集包含经过清理的推文数据,主要用于灾难监测和情感分析。主要特征如下: 时间跨度:数据记录的时间范围从2015年到2020年。...
    packageimg
  • 电信公司客户评价数据集TrustpilotReviewsof3TelecommDataset-pchristensen

    2025年4月24日   

    电信公司客户评价数据集TrustpilotReviewsof3TelecommDataset-pchristensen 数据来源:互联网公开数据 标签:客户评价,电信行业,数据集,情感分析,机器学习,自然语言处理,商业智能,服务质量...
    packageimg
  • 翻译数据集TranslatedDataset-waelfezari

    2025年4月24日   

    翻译数据集TranslatedDataset-waelfezari 数据来源:互联网公开数据 标签:机器翻译,数据集,自然语言处理,文本分析,语言学,多语言,深度学习,文本对齐 数据概述: 该数据集包含多种语言的翻译文本对,用于机器翻译模型的训练和评估。主要特征如下: 时间跨度:数据记录的时间范围不固定,取决于具体数据集的创建时间。...
    packageimg
  • 词向量模型数据集GloVe-mlethics

    2025年4月24日   

    词向量模型数据集GloVe-mlethics 数据来源:互联网公开数据 标签:词向量,自然语言处理,文本分析,机器学习,深度学习,语义分析,词嵌入,NLP 数据概述: 该数据集包含了由斯坦福大学开发的GloVe(Global Vectors for Word Representation)词向量模型。主要特征如下:...
    packageimg
  • 增强数据自然语言处理数据集AugmentdData-NLP-ahmedmohamed365

    2025年4月24日   

    增强数据自然语言处理数据集AugmentdData-NLP-ahmedmohamed365 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本增强,数据扩充,机器学习,深度学习,文本分析,NLP 数据概述: 该数据集包含增强的自然语言处理(NLP)数据,旨在提升NLP模型的性能和鲁棒性。主要特征如下: 时间跨度:...
    packageimg
  • 翻译项目CSV数据集TranslatedCSVDataset-ahensetihom

    2025年4月24日   

    翻译项目CSV数据集TranslatedCSVDataset-ahensetihom 数据来源:互联网公开数据 标签:翻译项目,CSV数据,语言处理,自然语言处理,数据集,文本分析,机器学习,多语言研究 数据概述:该数据集包含来自多个翻译项目的CSV格式数据,记录了不同语言文本之间的翻译结果。主要特征如下:...
    packageimg