-
Reddit社区评论情感分析数据集RedditCommentsSentimentAnalysisDataset-diyashreedevadiga
Reddit社区评论情感分析数据集RedditCommentsSentimentAnalysisDataset-diyashreedevadiga 数据来源:互联网公开数据 标签:社交媒体,情感分析,自然语言处理,文本数据,机器学习,评论数据,舆情分析,文本挖掘 数据概述:... -
命名实体识别数据集NERDatasets-a7med7m0stvfa
命名实体识别数据集NERDatasets-a7med7m0stvfa 数据来源:互联网公开数据 标签:命名实体识别,自然语言处理,文本分析,机器学习,数据集,人工智能,信息提取,语言技术 数据概述: 该数据集包含多种文本数据,记录了文本中的命名实体信息。主要特征如下: 时间跨度:数据记录的时间范围不固定,涵盖多个时间段的文本数据。... -
孟加拉国新闻标题数据集BangladeshNewsHeadlinesDataset-ishtyaquemikrani
孟加拉国新闻标题数据集BangladeshNewsHeadlinesDataset-ishtyaquemikrani 数据来源:互联网公开数据 标签:新闻分析,数据集,文本挖掘,自然语言处理,机器学习,媒体研究,新闻分类,语言模型 数据概述: 该数据集包含来自孟加拉国新闻媒体的新闻标题数据,记录了新闻标题的文本内容。主要特征如下:... -
食谱生成器烹饪数据集RecipeGeneratorCookingDataset-siva1206
食谱生成器烹饪数据集RecipeGeneratorCookingDataset-siva1206 数据来源:互联网公开数据 标签:食谱,烹饪,数据集,菜谱,食材,自然语言处理,机器学习,文本生成 数据概述: 该数据集包含来自互联网的食谱数据,记录了各种菜肴的详细信息,旨在用于食谱生成和烹饪相关的研究。主要特征如下:... -
生态旅行文档分类数据集EcotrekDocumentClassificationDataset-hachemsfar
生态旅行文档分类数据集EcotrekDocumentClassificationDataset-hachemsfar 数据来源:互联网公开数据 标签:文档分类,自然语言处理,机器学习,数据集,环境研究,文本分析,生态旅游,信息检索 数据概述: 该数据集包含来自生态旅行领域的文档数据,记录了与生态旅游相关的各类文档的分类信息。主要特征如下:... -
-
自然语言处理训练脚本数据集NLPTrainScriptDataset-hertz192
自然语言处理训练脚本数据集NLPTrainScriptDataset-hertz192 数据来源:互联网公开数据 标签:自然语言处理,训练脚本,数据集,机器学习,文本分析,语言模型,人工智能,深度学习 数据概述: 该数据集包含用于自然语言处理(NLP)任务的训练脚本和数据,主要服务于语言模型的训练和优化。主要特征如下:... -
Flickr30K邦加拉语数据集Flicker30KBanglaDataset-arifmahmoodsarker
Flickr30K邦加拉语数据集Flicker30KBanglaDataset-arifmahmoodsarker 数据来源:互联网公开数据 标签:Flickr, 邦加拉语, 图像标注, 数据集, 机器学习, 自然语言处理, 图像识别, 多语言支持 数据概述: 该数据集包含来自 Flickr 30K 数据集的图像和其对应的邦加拉语描述。主要特征如下:... -
Steam游戏评测测试数据集Steam游戏评测测试数据集-jainkanishk95
Steam游戏评测测试数据集Steam游戏评测测试数据集-jainkanishk95 数据来源:互联网公开数据 标签:Steam, 游戏评测, 数据集, 用户反馈, 自然语言处理, 游戏产业, 机器学习, 情感分析 数据概述:该数据集包含来自Steam平台的游戏评测数据,记录了用户对游戏的评价和反馈。主要特征如下:... -
YouTube垃圾评论数据集2015-2020-rsiindicator
YouTube垃圾评论数据集2015-2020-rsiindicator 数据来源:互联网公开数据 标签:YouTube, 垃圾评论, 数据集, 自然语言处理, 机器学习, 情感分析, 社交媒体, 数据清洗 数据概述:该数据集包含来自YouTube平台的评论数据,记录了大量视频下的用户评论,特别关注其中的垃圾评论。主要特征如下:... -
注释者数据集72022年Annnotators72022Dataset-jakir57
注释者数据集72022年Annnotators72022Dataset-jakir57 数据来源:互联网公开数据 标签:注释者,数据集,自然语言处理,文本标注,机器学习,人工智能,文本分析,数据科学 数据概述: 该数据集包含2022年来自7名注释者的标注数据,记录了他们在文本标注任务中的详细信息。主要特征如下:... -
医学影像报告数据集ImageReportsDataset-noorsaeed
医学影像报告数据集ImageReportsDataset-noorsaeed 数据来源:互联网公开数据 标签:医学影像,数据集,自然语言处理,临床研究,人工智能,医疗数据,临床报告,机器学习 数据概述: 该数据集包含来自医学影像报告的数据,记录了患者医学影像检查的详细报告信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。... -
论文相似度检测数据集EssaySimilarityDatasetUsingLLM-premiugv
论文相似度检测数据集EssaySimilarityDatasetUsingLLM-premiugv 数据来源:互联网公开数据 标签:自然语言处理,文本相似度,数据集,机器学习,学术论文,文本分析,人工智能,教育技术 数据概述: 该数据集包含使用大型语言模型(LLM)进行论文相似度检测的详细数据,记录了多篇学术论文之间的相似度分析。主要特征如下:... -
数据科学家职位空缺数据集DataScientistVacanciesDataset-trimparashut
数据科学家职位空缺数据集DataScientistVacanciesDataset-trimparashut 数据来源:互联网公开数据 标签:数据科学,职位空缺,招聘信息,文本挖掘,自然语言处理,机器学习,职业发展,行业分析 数据概述: 该数据集包含了来自互联网的关于数据科学家职位空缺的信息,记录了不同公司和地区的招聘广告详情。主要特征如下:... -
消费者产品评论情感分析数据集ReviewswithNullWordsandAspect-BasedSentimentAnalysisDataset-len...
消费者产品评论情感分析数据集ReviewswithNullWordsandAspect-BasedSentimentAnalysisDataset-lengocquangkaggle255 数据来源:互联网公开数据 标签:消费者评论,情感分析,数据集,自然语言处理,机器学习,文本挖掘,产品评价,商业智能... -
维基百科电影剧情数据集WikiMoviePlotsDataset-marat102
维基百科电影剧情数据集WikiMoviePlotsDataset-marat102 数据来源:互联网公开数据 标签:电影,剧情分析,数据集,文本挖掘,自然语言处理,内容分析,文化研究,机器学习 数据概述: 该数据集包含来自维基百科的电影剧情数据,记录了全球范围内电影的剧情摘要和相关信息。主要特征如下: 时间跨度:... -
自然语言处理作业二数据集NLPHomework2Dataset-andrewmilko
自然语言处理作业二数据集NLPHomework2Dataset-andrewmilko 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分类,情感分析,机器学习,文本处理,深度学习,作业 数据概述: 该数据集用于自然语言处理(NLP)的作业二,主要包含文本数据,用于训练和评估各种NLP模型。主要特征如下: 时间跨度:... -
PubMed医学文章摘要数据集PubMedArticlesAbstractDataset-luchsmann
PubMed医学文章摘要数据集PubMedArticlesAbstractDataset-luchsmann 数据来源:互联网公开数据 标签:医学研究,数据集,自然语言处理,生物信息学,机器学习,文献分析,文本挖掘,人工智能 数据概述: 该数据集包含来自PubMed数据库的医学文章摘要数据,记录了医学领域的研究论文摘要信息。主要特征如下:... -
MBA论文分析数据集-siddharthshihvaghela
MBA论文分析数据集-siddharthshihvaghela 数据来源:互联网公开数据 标签:MBA,论文,学术研究,文本分析,自然语言处理,教育,管理学,数据集 数据概述:该数据集包含MBA论文的摘要,关键词,年份,学校等信息,旨在用于学术研究和教育目的。主要特征如下: 时间跨度:数据记录的时间范围为近年来。... -
英国癌症文本挖掘与分析数据集UKCancerTextMiningandAnalysisDataset-moamenibrahim
英国癌症文本挖掘与分析数据集UKCancerTextMiningandAnalysisDataset-moamenibrahim 数据来源:互联网公开数据 标签:癌症研究,文本挖掘,数据分析,医学研究,机器学习,自然语言处理,生物信息学,健康医疗 数据概述: 该数据集包含来自英国癌症研究机构的数据,记录了与癌症相关的文本信息及分析结果。主要特征如下:...