找到12,007个数据集

标签: 自然语言处理

过滤结果
  • Reddit社区评论情感分析数据集RedditCommentsSentimentAnalysisDataset-diyashreedevadiga

    2025年4月26日   

    Reddit社区评论情感分析数据集RedditCommentsSentimentAnalysisDataset-diyashreedevadiga 数据来源:互联网公开数据 标签:社交媒体,情感分析,自然语言处理,文本数据,机器学习,评论数据,舆情分析,文本挖掘 数据概述:...
    packageimg
  • 命名实体识别数据集NERDatasets-a7med7m0stvfa

    2025年4月26日   

    命名实体识别数据集NERDatasets-a7med7m0stvfa 数据来源:互联网公开数据 标签:命名实体识别,自然语言处理,文本分析,机器学习,数据集,人工智能,信息提取,语言技术 数据概述: 该数据集包含多种文本数据,记录了文本中的命名实体信息。主要特征如下: 时间跨度:数据记录的时间范围不固定,涵盖多个时间段的文本数据。...
    packageimg
  • 孟加拉国新闻标题数据集BangladeshNewsHeadlinesDataset-ishtyaquemikrani

    2025年4月26日   

    孟加拉国新闻标题数据集BangladeshNewsHeadlinesDataset-ishtyaquemikrani 数据来源:互联网公开数据 标签:新闻分析,数据集,文本挖掘,自然语言处理,机器学习,媒体研究,新闻分类,语言模型 数据概述: 该数据集包含来自孟加拉国新闻媒体的新闻标题数据,记录了新闻标题的文本内容。主要特征如下:...
    packageimg
  • 食谱生成器烹饪数据集RecipeGeneratorCookingDataset-siva1206

    2025年4月26日   

    食谱生成器烹饪数据集RecipeGeneratorCookingDataset-siva1206 数据来源:互联网公开数据 标签:食谱,烹饪,数据集,菜谱,食材,自然语言处理,机器学习,文本生成 数据概述: 该数据集包含来自互联网的食谱数据,记录了各种菜肴的详细信息,旨在用于食谱生成和烹饪相关的研究。主要特征如下:...
    packageimg
  • 生态旅行文档分类数据集EcotrekDocumentClassificationDataset-hachemsfar

    2025年4月26日   

    生态旅行文档分类数据集EcotrekDocumentClassificationDataset-hachemsfar 数据来源:互联网公开数据 标签:文档分类,自然语言处理,机器学习,数据集,环境研究,文本分析,生态旅游,信息检索 数据概述: 该数据集包含来自生态旅行领域的文档数据,记录了与生态旅游相关的各类文档的分类信息。主要特征如下:...
    packageimg
  • 维基百科电影剧情向量嵌入数据集

    2025年4月26日   

    维基百科电影剧情向量嵌入数据集 数据来源:互联网公开数据 标签:电影剧情,向量嵌入,自然语言处理,数据挖掘,机器学习,文本分析 数据概述:...
    packageimg
  • 自然语言处理训练脚本数据集NLPTrainScriptDataset-hertz192

    2025年4月26日   

    自然语言处理训练脚本数据集NLPTrainScriptDataset-hertz192 数据来源:互联网公开数据 标签:自然语言处理,训练脚本,数据集,机器学习,文本分析,语言模型,人工智能,深度学习 数据概述: 该数据集包含用于自然语言处理(NLP)任务的训练脚本和数据,主要服务于语言模型的训练和优化。主要特征如下:...
    packageimg
  • Flickr30K邦加拉语数据集Flicker30KBanglaDataset-arifmahmoodsarker

    2025年4月26日   

    Flickr30K邦加拉语数据集Flicker30KBanglaDataset-arifmahmoodsarker 数据来源:互联网公开数据 标签:Flickr, 邦加拉语, 图像标注, 数据集, 机器学习, 自然语言处理, 图像识别, 多语言支持 数据概述: 该数据集包含来自 Flickr 30K 数据集的图像和其对应的邦加拉语描述。主要特征如下:...
    packageimg
  • Steam游戏评测测试数据集Steam游戏评测测试数据集-jainkanishk95

    2025年4月26日   

    Steam游戏评测测试数据集Steam游戏评测测试数据集-jainkanishk95 数据来源:互联网公开数据 标签:Steam, 游戏评测, 数据集, 用户反馈, 自然语言处理, 游戏产业, 机器学习, 情感分析 数据概述:该数据集包含来自Steam平台的游戏评测数据,记录了用户对游戏的评价和反馈。主要特征如下:...
    packageimg
  • YouTube垃圾评论数据集2015-2020-rsiindicator

    2025年4月26日   

    YouTube垃圾评论数据集2015-2020-rsiindicator 数据来源:互联网公开数据 标签:YouTube, 垃圾评论, 数据集, 自然语言处理, 机器学习, 情感分析, 社交媒体, 数据清洗 数据概述:该数据集包含来自YouTube平台的评论数据,记录了大量视频下的用户评论,特别关注其中的垃圾评论。主要特征如下:...
    packageimg
  • 注释者数据集72022年Annnotators72022Dataset-jakir57

    2025年4月26日   

    注释者数据集72022年Annnotators72022Dataset-jakir57 数据来源:互联网公开数据 标签:注释者,数据集,自然语言处理,文本标注,机器学习,人工智能,文本分析,数据科学 数据概述: 该数据集包含2022年来自7名注释者的标注数据,记录了他们在文本标注任务中的详细信息。主要特征如下:...
    packageimg
  • 医学影像报告数据集ImageReportsDataset-noorsaeed

    2025年4月26日   

    医学影像报告数据集ImageReportsDataset-noorsaeed 数据来源:互联网公开数据 标签:医学影像,数据集,自然语言处理,临床研究,人工智能,医疗数据,临床报告,机器学习 数据概述: 该数据集包含来自医学影像报告的数据,记录了患者医学影像检查的详细报告信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。...
    packageimg
  • 论文相似度检测数据集EssaySimilarityDatasetUsingLLM-premiugv

    2025年4月26日   

    论文相似度检测数据集EssaySimilarityDatasetUsingLLM-premiugv 数据来源:互联网公开数据 标签:自然语言处理,文本相似度,数据集,机器学习,学术论文,文本分析,人工智能,教育技术 数据概述: 该数据集包含使用大型语言模型(LLM)进行论文相似度检测的详细数据,记录了多篇学术论文之间的相似度分析。主要特征如下:...
    packageimg
  • 数据科学家职位空缺数据集DataScientistVacanciesDataset-trimparashut

    2025年4月26日   

    数据科学家职位空缺数据集DataScientistVacanciesDataset-trimparashut 数据来源:互联网公开数据 标签:数据科学,职位空缺,招聘信息,文本挖掘,自然语言处理,机器学习,职业发展,行业分析 数据概述: 该数据集包含了来自互联网的关于数据科学家职位空缺的信息,记录了不同公司和地区的招聘广告详情。主要特征如下:...
    packageimg
  • 消费者产品评论情感分析数据集ReviewswithNullWordsandAspect-BasedSentimentAnalysisDataset-len...

    2025年4月26日   

    消费者产品评论情感分析数据集ReviewswithNullWordsandAspect-BasedSentimentAnalysisDataset-lengocquangkaggle255 数据来源:互联网公开数据 标签:消费者评论,情感分析,数据集,自然语言处理,机器学习,文本挖掘,产品评价,商业智能...
    packageimg
  • 维基百科电影剧情数据集WikiMoviePlotsDataset-marat102

    2025年4月26日   

    维基百科电影剧情数据集WikiMoviePlotsDataset-marat102 数据来源:互联网公开数据 标签:电影,剧情分析,数据集,文本挖掘,自然语言处理,内容分析,文化研究,机器学习 数据概述: 该数据集包含来自维基百科的电影剧情数据,记录了全球范围内电影的剧情摘要和相关信息。主要特征如下: 时间跨度:...
    packageimg
  • 自然语言处理作业二数据集NLPHomework2Dataset-andrewmilko

    2025年4月26日   

    自然语言处理作业二数据集NLPHomework2Dataset-andrewmilko 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分类,情感分析,机器学习,文本处理,深度学习,作业 数据概述: 该数据集用于自然语言处理(NLP)的作业二,主要包含文本数据,用于训练和评估各种NLP模型。主要特征如下: 时间跨度:...
    packageimg
  • PubMed医学文章摘要数据集PubMedArticlesAbstractDataset-luchsmann

    2025年4月26日   

    PubMed医学文章摘要数据集PubMedArticlesAbstractDataset-luchsmann 数据来源:互联网公开数据 标签:医学研究,数据集,自然语言处理,生物信息学,机器学习,文献分析,文本挖掘,人工智能 数据概述: 该数据集包含来自PubMed数据库的医学文章摘要数据,记录了医学领域的研究论文摘要信息。主要特征如下:...
    packageimg
  • MBA论文分析数据集-siddharthshihvaghela

    2025年4月26日   

    MBA论文分析数据集-siddharthshihvaghela 数据来源:互联网公开数据 标签:MBA,论文,学术研究,文本分析,自然语言处理,教育,管理学,数据集 数据概述:该数据集包含MBA论文的摘要,关键词,年份,学校等信息,旨在用于学术研究和教育目的。主要特征如下: 时间跨度:数据记录的时间范围为近年来。...
    packageimg
  • 英国癌症文本挖掘与分析数据集UKCancerTextMiningandAnalysisDataset-moamenibrahim

    2025年4月26日   

    英国癌症文本挖掘与分析数据集UKCancerTextMiningandAnalysisDataset-moamenibrahim 数据来源:互联网公开数据 标签:癌症研究,文本挖掘,数据分析,医学研究,机器学习,自然语言处理,生物信息学,健康医疗 数据概述: 该数据集包含来自英国癌症研究机构的数据,记录了与癌症相关的文本信息及分析结果。主要特征如下:...
    packageimg