-
Python推荐书籍数据集-divyasaxena930
Python推荐书籍数据集-divyasaxena930 数据来源:互联网公开数据 标签:书籍推荐,Python,数据集,机器学习,自然语言处理,协同过滤,文本分析,数据挖掘 数据概述: 该数据集包含关于使用Python进行书籍推荐的信息,记录了用户对书籍的评价,书籍的详细信息以及推荐系统的相关数据。主要特征如下:... -
数据2023电影评论数据集2023MoviesReviewsDataset-muhammadzeshanhaider
2023电影评论数据集2023MoviesReviewsDataset-muhammadzeshanhaider 数据来源:互联网公开数据 标签:电影评论,数据集,文本分析,自然语言处理,电影研究,情感分析,社交媒体,用户评价 数据概述:该数据集包含来自互联网公开渠道的2023年电影评论数据,记录了多部电影的观众评论及评分。主要特征如下:... -
数据2021年社交媒体骚乱相关推文数据集ExtractedSAUnrestTweets2021Dataset-liadperetz
2021年社交媒体骚乱相关推文数据集ExtractedSAUnrestTweets2021Dataset-liadperetz 数据来源:互联网公开数据 标签:社交媒体,骚乱,推文,数据集,自然语言处理,社会分析,情绪分析,新闻研究... -
毒性评论属性分析数据集ToxicityCommentAttributeAnalysisDataset-shuestis
毒性评论属性分析数据集ToxicityCommentAttributeAnalysisDataset-shuestis 数据来源:互联网公开数据 标签:毒性评论,数据集,自然语言处理,机器学习,文本分析,社会研究,伦理学,人工智能 数据概述:该数据集包含了来自Jigsaw平台的评论数据,记录了评论的毒性及其相关属性。主要特征如下:... -
数据2013至2019年论文修改数据集ModifiedThesisDataset2013-2019-hanasm
2013至2019年论文修改数据集ModifiedThesisDataset2013-2019-hanasm 数据来源:互联网公开数据 标签:学术研究,论文修改,数据集,文献分析,机器学习,自然语言处理,教育技术,数据挖掘 数据概述: 该数据集包含来自2013年至2019年期间学术论文的修改记录,记录了论文的修改历史和反馈信息。主要特征如下:... -
Reddit社区仇恨言论检测数据集-devanshivipul
Reddit社区仇恨言论检测数据集-devanshivipul 数据来源:互联网公开数据 标签:社交媒体,仇恨言论,文本分析,自然语言处理,机器学习,情感分析,言论审查,数据集 数据概述: 该数据集包含来自Reddit社区的评论数据,用于仇恨言论的检测和分析。主要特征如下: 时间跨度:数据记录的时间跨度不详,但覆盖了Reddit社区的长期活跃时期。... -
麦当劳评论数据集6个月情感分析McDonald-sReviewDataset-6MonthsSentimentAnalysis-yorkyong
麦当劳评论数据集6个月情感分析McDonald-sReviewDataset-6MonthsSentimentAnalysis-yorkyong 数据来源:互联网公开数据 标签:餐饮业,情感分析,数据集,自然语言处理,客户反馈,机器学习,商业智能,用户体验 数据概述: 该数据集记录了麦当劳餐厅的用户评论数据,并包含情感分析标签。主要特征如下:... -
情感分析数据集Positive-Neutral-NegativeSentimentAnalysisDataset-jayeshchak
情感分析数据集Positive-Neutral-NegativeSentimentAnalysisDataset-jayeshchak 数据来源:互联网公开数据 标签:情感分析,数据集,自然语言处理,机器学习,文本分类,数据挖掘,人工智能,情感识别 数据概述: 该数据集包含来自互联网公开来源的情感分析数据,记录了文本内容的情感倾向。主要特征如下:... -
数据科学推文数据集
数据科学推文数据集 数据来源:互联网公开数据 标签:数据科学,数据分析,数据可视化,推文,社交媒体,时间序列分析,趋势分析,机器学习,自然语言处理 数据概述:... -
医疗问答检索增强生成数据集MedicalChatforRAGDataset-ahmedasd102
医疗问答检索增强生成数据集MedicalChatforRAGDataset-ahmedasd102 数据来源:互联网公开数据 标签:医疗,问答,数据集,检索增强生成,自然语言处理,医学,人工智能,知识图谱 数据概述: 该数据集包含用于医疗领域问答任务的数据,旨在支持基于检索增强生成(RAG)技术的应用。主要特征如下: 时间跨度:... -
巴西桑巴音乐歌词数据集BrazilianMusicSambaLyricsDataset-clovesgtx
巴西桑巴音乐歌词数据集BrazilianMusicSambaLyricsDataset-clovesgtx 数据来源:互联网公开数据 标签:音乐,歌词,数据集,巴西文化,数据挖掘,自然语言处理,音乐分析,文化研究 数据概述: 该数据集包含来自巴西桑巴音乐歌词的数据,记录了多首桑巴歌曲的歌词内容。主要特征如下:... -
仇恨言论分类数据集HateSpeechDatasetwithClassification-rohansandipborhade
仇恨言论分类数据集HateSpeechDatasetwithClassification-rohansandipborhade 数据来源:互联网公开数据 标签:仇恨言论,文本分类,自然语言处理,机器学习,情感分析,社交媒体,数据集,舆情分析 数据概述: 该数据集包含了来自社交媒体平台的文本数据,并标注了是否包含仇恨言论。主要特征如下:... -
自然语言处理与信息检索INLP作业3数据集INLPAssignment3Dataset-shubhamkathiriya
自然语言处理与信息检索INLP作业3数据集INLPAssignment3Dataset-shubhamkathiriya 数据来源:互联网公开数据 标签:自然语言处理,信息检索,数据集,文本分类,机器学习,深度学习,文本分析,数据挖掘 数据概述:... -
有毒评论分类数据集ToxicCommentClassificationDataset-akashsuper2000
有毒评论分类数据集ToxicCommentClassificationDataset-akashsuper2000 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,机器学习,情感分析,社交网络,数据挖掘,人工智能 数据概述: 该数据集包含来自互联网公开平台的用户评论数据,记录了各类文本评论及其毒性分类标签。主要特征如下:... -
餐厅评论数据集-mdfaishalahmedrudroo
餐厅评论数据集-mdfaishalahmedrudroo 数据来源:互联网公开数据 标签:餐厅,评论,数据集,情感分析,自然语言处理,文本挖掘,用户评价,餐饮业 数据概述:该数据集包含来自互联网的餐厅评论数据,记录了用户对餐厅的评价和相关信息。主要特征如下: 时间跨度:数据记录的时间范围不明确,但包含了近期和历史的评论。... -
BM25基础训练集数据集-danielphalen
BM25基础训练集数据集-danielphalen 数据来源:互联网公开数据 标签:信息检索,文本处理,数据集,自然语言处理,BM25,搜索算法,文本相似度,机器学习 数据概述:该数据集包含用于训练和评估BM25(Best Match 25)模型的文本数据,主要用于信息检索任务。主要特征如下: 时间跨度:数据涵盖了从特定时间段内收集的文本数据。... -
Airbnb房源词频统计数据集KBSAirbnbWordcountDataset-kimbaekseyeong
Airbnb房源词频统计数据集KBSAirbnbWordcountDataset-kimbaekseyeong 数据来源:互联网公开数据 标签:Airbnb, 数据集, 词频统计, 自然语言处理, 旅游, 房源描述, 机器学习, 文本分析 数据概述:该数据集包含来自Airbnb的房源描述文本数据,记录了房源描述的词频统计信息。主要特征如下:... -
英文文本序列长度验证数据集SequenceLength128-bamps53
英文文本序列长度验证数据集SequenceLength128-bamps53 数据来源:互联网公开数据 标签:自然语言处理,文本处理,序列建模,数据集,机器学习,文本验证,文本分析,深度学习 数据概述: 该数据集包含经过处理的英文文本数据,主要用于验证和测试自然语言处理模型,特别是针对序列长度为128的文本序列。主要特征如下:... -
图像描述数据集CaptionsDataset-pratyakshagarwal93
图像描述数据集CaptionsDataset-pratyakshagarwal93 数据来源:互联网公开数据 标签:图像标注,数据集,自然语言处理,计算机视觉,深度学习,人工智能,多媒体,数据挖掘 数据概述: 该数据集包含大量图像及其对应的文本描述,记录了图像的内容和特征。主要特征如下: 时间跨度:数据记录的时间范围不固定,涵盖多个年份的图像和描述。... -
维基百科文章上下文语境数据集WikipediaArticleContextDataset-yalickj
维基百科文章上下文语境数据集WikipediaArticleContextDataset-yalickj 数据来源:互联网公开数据 标签:自然语言处理,文本分析,维基百科,数据集,语境理解,机器学习,文本挖掘,知识图谱 数据概述:该数据集包含来自维基百科的文章数据,旨在研究文章的上下文语境信息。主要特征如下:...