-
美国民主党候选人推文数据集DemocraticNationalCommitteeCandidatesTweetsDataset-sheikhhanif
美国民主党候选人推文数据集DemocraticNationalCommitteeCandidatesTweetsDataset-sheikhhanif 数据来源:互联网公开数据 标签:政治,社交媒体,数据集,文本分析,情感分析,机器学习,选举研究,舆论分析 数据概述:... -
文本分类数据集TextClassificationDataset-albellna
文本分类数据集TextClassificationDataset-albellna 数据来源:互联网公开数据 标签:文本分类,自然语言处理,数据集,机器学习,文本分析,信息检索,人工智能,语言模型 数据概述: 该数据集包含来自多个来源的文本数据,记录了不同类别文本的样本,适用于文本分类,情感分析等应用。主要特征如下:... -
酒店评论原始数据数据集-ztamnaja
酒店评论原始数据数据集-ztamnaja 数据来源:互联网公开数据 标签:酒店,评论,文本分析,情感分析,自然语言处理,数据集,旅游,客户体验 数据概述: 该数据集包含来自不同来源的酒店评论数据,记录了客户对酒店的评价和反馈。主要特征如下: 时间跨度:数据记录的时间范围跨度不详,具体取决于原始数据来源。 地理范围:数据覆盖全球范围内的酒店。... -
Goodreads图书推荐数据集-rohitganeshkar
Goodreads图书推荐数据集-rohitganeshkar 数据来源:互联网公开数据 标签:图书推荐,数据集,自然语言处理,机器学习,推荐系统,文本分析,用户行为,书评 数据概述: 该数据集包含来自Goodreads网站的图书推荐数据,记录了用户对书籍的评价,评论及相关信息。主要特征如下:... -
自然语言处理语言检测数据集LanguageDetectionNLPDataset-tharun369
自然语言处理语言检测数据集LanguageDetectionNLPDataset-tharun369 数据来源:互联网公开数据 标签:自然语言处理,语言检测,数据集,文本分析,机器学习,文本分类,语言学,计算机科学 数据概述:该数据集包含来自多个来源的文本数据,用于自然语言处理中的语言检测任务。主要特征如下:... -
标签分析情感分类数据集LabelAnalysisSentimentClassificationDataset-swetasuman17
标签分析情感分类数据集LabelAnalysisSentimentClassificationDataset-swetasuman17 数据来源:互联网公开数据 标签:标签分析,情感分类,数据集,自然语言处理,机器学习,文本分析,情感研究,数据分析 数据概述:该数据集包含来自互联网的文本数据,记录了用户对不同标签的情感反馈和评价。主要特征如下:... -
学术会议论文数据集AcademicConferencesPapersDataset-igalbronshtein
学术会议论文数据集AcademicConferencesPapersDataset-igalbronshtein 数据来源:互联网公开数据 标签:学术会议,论文,数据集,自然语言处理,文本分析,信息检索,学术研究,机器学习 数据概述: 该数据集包含来自多个学术会议的论文数据,记录了会议论文的标题,摘要,关键词,作者信息等。主要特征如下:... -
灾害推文预处理数据集DisasterTweetsPreprocessedDataset-vladyslavsh
灾害推文预处理数据集DisasterTweetsPreprocessedDataset-vladyslavsh 数据来源:互联网公开数据 标签:灾害管理,社交网络,数据集,文本分析,机器学习,自然语言处理,危机响应,信息提取 数据概述:该数据集包含预处理过的推文数据,这些推文与自然灾害事件相关。主要特征如下:... -
苹果公司季度财报发布前后推文数据集-rajaanss
苹果公司季度财报发布前后推文数据集-rajaanss 数据来源:互联网公开数据 标签:苹果公司,推文,社交媒体,情感分析,季度财报,股票市场,自然语言处理,文本分析 数据概述: 该数据集包含来自Twitter的推文数据,记录了在苹果公司发布季度财报前后一段时间内的推文内容。主要特征如下:... -
Python推荐书籍数据集-divyasaxena930
Python推荐书籍数据集-divyasaxena930 数据来源:互联网公开数据 标签:书籍推荐,Python,数据集,机器学习,自然语言处理,协同过滤,文本分析,数据挖掘 数据概述: 该数据集包含关于使用Python进行书籍推荐的信息,记录了用户对书籍的评价,书籍的详细信息以及推荐系统的相关数据。主要特征如下:... -
数据2023电影评论数据集2023MoviesReviewsDataset-muhammadzeshanhaider
2023电影评论数据集2023MoviesReviewsDataset-muhammadzeshanhaider 数据来源:互联网公开数据 标签:电影评论,数据集,文本分析,自然语言处理,电影研究,情感分析,社交媒体,用户评价 数据概述:该数据集包含来自互联网公开渠道的2023年电影评论数据,记录了多部电影的观众评论及评分。主要特征如下:... -
毒性评论属性分析数据集ToxicityCommentAttributeAnalysisDataset-shuestis
毒性评论属性分析数据集ToxicityCommentAttributeAnalysisDataset-shuestis 数据来源:互联网公开数据 标签:毒性评论,数据集,自然语言处理,机器学习,文本分析,社会研究,伦理学,人工智能 数据概述:该数据集包含了来自Jigsaw平台的评论数据,记录了评论的毒性及其相关属性。主要特征如下:... -
英语古兰经EnglishQuranDataset-esraaaabdelrazek
英语古兰经EnglishQuranDataset-esraaaabdelrazek 数据来源:互联网公开数据 标签:古兰经,数据集,宗教,伊斯兰教,翻译,文本分析,语言学,学术研究 数据概述: 该数据集包含英语翻译的《古兰经》,记录了古兰经的文本内容及其相关注释。主要特征如下: 时间跨度:数据记录的时间范围从现代翻译版本开始。... -
Reddit社区仇恨言论检测数据集-devanshivipul
Reddit社区仇恨言论检测数据集-devanshivipul 数据来源:互联网公开数据 标签:社交媒体,仇恨言论,文本分析,自然语言处理,机器学习,情感分析,言论审查,数据集 数据概述: 该数据集包含来自Reddit社区的评论数据,用于仇恨言论的检测和分析。主要特征如下: 时间跨度:数据记录的时间跨度不详,但覆盖了Reddit社区的长期活跃时期。... -
自然语言处理与信息检索INLP作业3数据集INLPAssignment3Dataset-shubhamkathiriya
自然语言处理与信息检索INLP作业3数据集INLPAssignment3Dataset-shubhamkathiriya 数据来源:互联网公开数据 标签:自然语言处理,信息检索,数据集,文本分类,机器学习,深度学习,文本分析,数据挖掘 数据概述:... -
Airbnb房源词频统计数据集KBSAirbnbWordcountDataset-kimbaekseyeong
Airbnb房源词频统计数据集KBSAirbnbWordcountDataset-kimbaekseyeong 数据来源:互联网公开数据 标签:Airbnb, 数据集, 词频统计, 自然语言处理, 旅游, 房源描述, 机器学习, 文本分析 数据概述:该数据集包含来自Airbnb的房源描述文本数据,记录了房源描述的词频统计信息。主要特征如下:... -
英文文本序列长度验证数据集SequenceLength128-bamps53
英文文本序列长度验证数据集SequenceLength128-bamps53 数据来源:互联网公开数据 标签:自然语言处理,文本处理,序列建模,数据集,机器学习,文本验证,文本分析,深度学习 数据概述: 该数据集包含经过处理的英文文本数据,主要用于验证和测试自然语言处理模型,特别是针对序列长度为128的文本序列。主要特征如下:... -
维基百科文章上下文语境数据集WikipediaArticleContextDataset-yalickj
维基百科文章上下文语境数据集WikipediaArticleContextDataset-yalickj 数据来源:互联网公开数据 标签:自然语言处理,文本分析,维基百科,数据集,语境理解,机器学习,文本挖掘,知识图谱 数据概述:该数据集包含来自维基百科的文章数据,旨在研究文章的上下文语境信息。主要特征如下:... -
元数据古腾堡数据集MetadataGutenbergDataset-mosesmoncy
元数据古腾堡数据集MetadataGutenbergDataset-mosesmoncy 数据来源:互联网公开数据 标签:文学,数据集,元数据,图书信息,数字图书馆,文本分析,学术研究,机器学习 数据概述: 该数据集包含来自古腾堡计划(Gutenberg Project)的图书元数据,记录了该计划收录的各类图书的详细信息。主要特征如下:... -
医疗问答数据集QA-MED-nguynvtng
医疗问答数据集QA-MED-nguynvtng 数据来源:互联网公开数据 标签:医疗,问答,数据集,自然语言处理,医学,机器学习,文本分析,知识图谱 数据概述: 该数据集包含医疗领域的问答对,旨在促进医疗领域的自然语言处理研究。主要特征如下: 时间跨度: 数据记录的时间范围不限,涵盖了不同时期的医疗知识。 地理范围:...