-
新闻组体育话题数据集NewsgroupSportsTopicDataset-cosimaxie
新闻组体育话题数据集NewsgroupSportsTopicDataset-cosimaxie 数据来源:互联网公开数据 标签:新闻组,体育话题,文本分析,自然语言处理,机器学习,数据集,分类算法,文本分类 数据概述: 该数据集包含来自新闻组的体育话题相关文本数据,记录了新闻组中关于体育赛事,运动员,球队等内容的讨论。主要特征如下:... -
新冠疫情Twitter热门推文数据集COVID-19PopularTweetsDataset-brahimenesulusoy
新冠疫情Twitter热门推文数据集COVID-19PopularTweetsDataset-brahimenesulusoy 数据来源:互联网公开数据 标签:新冠疫情,推文,社交媒体,数据集,文本分析,自然语言处理,情感分析,舆情监测 数据概述: 该数据集包含来自 Twitter 的关于新冠疫情的推文数据,记录了用户在 Twitter... -
图像公式转LaTeX数据集按尺寸排序im2latex-sorted-by-sizeDataset-tuannguyenvananh
图像公式转LaTeX数据集按尺寸排序im2latex-sorted-by-sizeDataset-tuannguyenvananh 数据来源:互联网公开数据 标签:计算机视觉,自然语言处理,数据集,图像识别,公式识别,LaTeX转换,机器学习,数学公式 数据概述:... -
CMSB性别歧视言论检测数据集CMSBSexistDetectionDataset-ccymforhpl
CMSB性别歧视言论检测数据集CMSBSexistDetectionDataset-ccymforhpl 数据来源:互联网公开数据 标签:性别歧视,文本分析,自然语言处理,数据集,情感分析,机器学习,社会科学,舆情分析 数据概述: 该数据集由... -
数据2018阿里巴巴NLP文本相似度数据集AtecNLPSimDataset-chongjiujjin
2018阿里巴巴NLP文本相似度数据集AtecNLPSimDataset-chongjiujjin 数据来源:互联网公开数据 标签:自然语言处理,文本相似度,数据集,机器学习,语义分析,人工智能,语言模型,情感分析 数据概述: 该数据集由阿里巴巴提供,专注于自然语言处理中的文本相似度任务。主要特征如下: 时间跨度:数据记录的时间范围为2018年。... -
Spotify无停用词歌词数据集SpotifyNoStopwordsLyricsDataset-machiavellianthought
Spotify无停用词歌词数据集SpotifyNoStopwordsLyricsDataset-machiavellianthought 数据来源:互联网公开数据 标签:音乐分析,歌词处理,自然语言处理,数据集,文本挖掘,机器学习,情感分析,数据科学 数据概述:... -
数据2019年至今财经新闻带标签数据集FinancialNewswithLabelssince2019Dataset-cy00cy
2019年至今财经新闻带标签数据集FinancialNewswithLabelssince2019Dataset-cy00cy 数据来源:互联网公开数据 标签:财经新闻,文本分析,数据集,情感分析,机器学习,自然语言处理,新闻分类,时间序列 数据概述:... -
电影评论情感分析测试数据集IMDbTestSentimentAnalysisDataset-victorvic
电影评论情感分析测试数据集IMDbTestSentimentAnalysisDataset-victorvic 数据来源:互联网公开数据 标签:电影评论,情感分析,数据集,自然语言处理,文本分类,机器学习,数据挖掘,人工智能 数据概述:... -
印度英语阅读理解训练数据集ChaiiTrainCleanDataset-trushk
印度英语阅读理解训练数据集ChaiiTrainCleanDataset-trushk 数据来源:互联网公开数据 标签:阅读理解,自然语言处理,数据集,文本分析,机器学习,英语,印度,语言学 数据概述: 该数据集包含来自 Chaii 竞赛的清理过的印度英语阅读理解训练数据,旨在帮助研究人员和开发人员训练和评估阅读理解模型。主要特征如下:... -
UIT-VSFC诗歌翻译数据集UIT-VSFCPoemTranslationDataset-haiimphuong
UIT-VSFC诗歌翻译数据集UIT-VSFCPoemTranslationDataset-haiimphuong 数据来源:互联网公开数据 标签:诗歌翻译,数据集,自然语言处理,机器翻译,文本分析,越南语,英语,语言学 数据概述: 该数据集包含来自UIT-VSFC项目提供的诗歌翻译数据,记录了越南语诗歌及其对应的英语翻译。主要特征如下:... -
股票价格预测基于新闻标题数据集2010-2020数据集-gauravduttakiit
股票价格预测基于新闻标题数据集2010-2020数据集-gauravduttakiit 数据来源:互联网公开数据 标签:股票预测,新闻分析,数据集,自然语言处理,机器学习,金融市场,经济研究,文本挖掘 数据概述: 该数据集包含来自2010年至2020年间的新闻标题数据,记录了与股票市场相关的新闻信息,适用于股票价格预测和市场情绪分析。主要特征如下:... -
推特美国航空公司舆情分析数据集TwitterUSAirlineSentimentDataset-dprudhviteja
推特美国航空公司舆情分析数据集TwitterUSAirlineSentimentDataset-dprudhviteja 数据来源:互联网公开数据 标签:社交媒体,航空公司,情感分析,数据集,自然语言处理,文本挖掘,机器学习,舆情分析 数据概述:... -
金融行业问答系统高质量文本片段数据集FinancialRAGBestChunksDataset-squarenabla
金融行业问答系统高质量文本片段数据集FinancialRAGBestChunksDataset-squarenabla 数据来源:互联网公开数据 标签:金融,问答系统,RAG,自然语言处理,数据集,文本分析,机器学习,信息检索 数据概述: 该数据集包含从金融领域文档中提取的,用于构建问答系统(RAG,Retrieval-Augmented... -
开放人工智能加勒比挑战赛数据集OpenAICaribbeanChallengeDataset-sayantandas30011998
开放人工智能加勒比挑战赛数据集OpenAICaribbeanChallengeDataset-sayantandas30011998 数据来源:互联网公开数据 标签:人工智能,加勒比地区,数据集,机器学习,自然语言处理,计算机视觉,挑战赛,数据科学 数据概述:... -
亚马逊Kindle消费者评论数据集AmazonKindleConsumerReviewDataset-monicoo2759
亚马逊Kindle消费者评论数据集AmazonKindleConsumerReviewDataset-monicoo2759 数据来源:互联网公开数据 标签:消费者评论,数据集,自然语言处理,文本分析,深度学习,电子商务,市场研究,用户体验... -
中文酒店评论情感分析数据集-quoniammm
中文酒店评论情感分析数据集-quoniammm 数据来源:互联网公开数据 标签:酒店评论,情感分析,自然语言处理,文本挖掘,机器学习,评论数据,中文文本,情感分类 数据概述: 该数据集包含来自中国酒店的顾客评论数据,记录了顾客对酒店服务的评价。主要特征如下: 时间跨度:数据记录的时间跨度不明确,取决于数据来源。... -
谣言检测数据集DatasetforRumourDetection-shaiksubhani22
谣言检测数据集DatasetforRumourDetection-shaiksubhani22 数据来源:互联网公开数据 标签:谣言检测,社交媒体,数据集,自然语言处理,机器学习,信息传播,社会学,数据分析 数据概述:该数据集包含来自社交媒体平台的谣言和非谣言信息,记录了用户发布的各种信息及其传播过程。主要特征如下:... -
电子商务产品评论数据集EcommerceProductsReviewsDataset-arslanabdulghaffar
电子商务产品评论数据集EcommerceProductsReviewsDataset-arslanabdulghaffar 数据来源:互联网公开数据 标签:电子商务,产品评论,数据集,文本分析,情感分析,自然语言处理,消费者行为,机器学习 数据概述: 该数据集包含来自各大电子商务平台的产品评论数据,记录了消费者对各类产品的评价信息。主要特征如下:... -
黑科弗数据提取与文本分析数据集BlackcofferDataExtractionandTextAnalysisDataset-ramkumar45
黑科弗数据提取与文本分析数据集BlackcofferDataExtractionandTextAnalysisDataset-ramkumar45 数据来源:互联网公开数据 标签:文本分析,数据提取,自然语言处理,机器学习,数据集,信息提取,文本挖掘,情感分析 数据概述:该数据集包含来自黑科弗公司的数据,专注于文本数据的提取和分析。主要特征如下:... -
新闻组文本分类数据集20NewsgroupTextClassificationDataset-kurianbenoy
新闻组文本分类数据集20NewsgroupTextClassificationDataset-kurianbenoy 数据来源:互联网公开数据 标签:文本分类,数据集,自然语言处理,机器学习,文本挖掘,信息检索,新闻组,数据科学 数据概述: 该数据集包含来自20个不同新闻组的文本数据,记录了从1993年到1994年的新闻文章。主要特征如下:...