-
叙利亚情感极性分析数据集PolaritySyriaEnglishDataset-khemkhammohamed
叙利亚情感极性分析数据集PolaritySyriaEnglishDataset-khemkhammohamed 数据来源:互联网公开数据 标签:情感分析,数据集,自然语言处理,文本挖掘,机器学习,政治研究,中东研究,英语文本 数据概述:该数据集包含来自叙利亚相关英语文本的情感极性标注数据,记录了针对叙利亚话题的文本内容的情感倾向信息。主要特征如下:... -
邮件内容分析数据集MailsDataset-riyahedaoo
邮件内容分析数据集MailsDataset-riyahedaoo 数据来源:互联网公开数据 标签:邮件分析,文本挖掘,数据集,自然语言处理,机器学习,信息提取,通信研究,商业智能 数据概述: 该数据集包含来自多个邮件系统的邮件内容数据,记录了各类邮件的文本信息。主要特征如下: 时间跨度:数据记录的时间范围从2000年到2020年。... -
自然语言处理与开放域问答数据集NLPOpen-DomainQuestionAnsweringDataset-zepedaerik
自然语言处理与开放域问答数据集NLPOpen-DomainQuestionAnsweringDataset-zepedaerik 数据来源:互联网公开数据 标签:自然语言处理,开放域问答,数据集,文本理解,机器学习,信息检索,人工智能,语言模型 数据概述: 该数据集包含来自开放域问答任务的数据,记录了用户提出的问题及对应的答案。主要特征如下:... -
推特用户性别预测数据集GenderPredictionDatasetBasedonTweets-siddheshshelke
推特用户性别预测数据集GenderPredictionDatasetBasedonTweets-siddheshshelke 数据来源:互联网公开数据 标签:社交媒体,推特,性别预测,自然语言处理,文本分析,机器学习,用户画像,数据挖掘 数据概述: 该数据集包含了来自推特的用户数据,主要用于预测用户的性别。主要特征如下: 时间跨度:... -
句子改写与同义表达数据集PAWSParaphrasingDataset-srinu513
句子改写与同义表达数据集PAWSParaphrasingDataset-srinu513 数据来源:互联网公开数据 标签:自然语言处理,文本改写,机器学习,语义分析,语言模型,NLP,数据集,语义相似度 数据概述:该数据集包含来自PAWS项目(Paraphrase Adversarial... -
Python自然语言处理实践数据集-ndrianahani
Python自然语言处理实践数据集-ndrianahani 数据来源:互联网公开数据 标签:自然语言处理,NLP,文本分析,数据集,Python,机器学习,语言模型,文本挖掘 数据概述: 该数据集包含用于Python自然语言处理实践的文本数据,涵盖了多种NLP任务和应用场景。主要特征如下: 时间跨度: 数据记录的时间范围不限,数据集内容持续更新。... -
越南语字幕数据集DataCaptiontoVietnameseDataset-tndtnguyn
越南语字幕数据集DataCaptiontoVietnameseDataset-tndtnguyn 数据来源:互联网公开数据 标签:字幕翻译,越南语,数据集,机器翻译,自然语言处理,文本分析,语言学,跨语言 数据概述:该数据集包含从英语到越南语的字幕翻译数据,用于字幕翻译任务。主要特征如下: 时间跨度:数据记录的时间范围不明确,取决于数据来源。... -
仇恨言论检测平衡数据集-nirmalgaud
仇恨言论检测平衡数据集-nirmalgaud 数据来源:互联网公开数据 标签:仇恨言论,文本分析,自然语言处理,情感分析,数据集,机器学习,社交媒体,语言学 数据概述: 该数据集收录了来自社交媒体平台的文本数据,旨在用于仇恨言论的检测与识别。主要特征如下: 时间跨度:数据记录的时间范围不明确,但涵盖了社交媒体上常见的文本内容发布时间。... -
全球旅游景点评论数据集PointofGlobal-TouristSpotReviewDataset-wertyuyuio
全球旅游景点评论数据集PointofGlobal-TouristSpotReviewDataset-wertyuyuio 数据来源:互联网公开数据 标签:旅游,景点,评论,情感分析,自然语言处理,数据集,文本挖掘,旅游业 数据概述: 该数据集包含来自全球旅游景点的大量评论数据,记录了游客对不同景点的评价和体验。主要特征如下:... -
泰卢固语英语翻译数据集TeluguEnglishTranslationDataset-gautamashastry
泰卢固语英语翻译数据集TeluguEnglishTranslationDataset-gautamashastry 数据来源:互联网公开数据 标签:泰卢固语,英语,翻译,数据集,语言学,自然语言处理,机器学习,文本分析 数据概述:该数据集包含来自多个来源的泰卢固语和英语的翻译数据,用于研究和开发语言翻译模型。主要特征如下:... -
亚马逊商品评论数据集AmazonProductReviewsDataset-purvitsharma
亚马逊商品评论数据集AmazonProductReviewsDataset-purvitsharma 数据来源:互联网公开数据 标签:电子商务,商品评论,数据集,自然语言处理,情感分析,机器学习,消费者行为,文本挖掘 数据概述: 该数据集包含来自亚马逊平台的商品评论数据,记录了用户对亚马逊平台上销售商品的评价。主要特征如下:... -
星球大战剧本台词数据集StarWarsScriptsAllLinesDataset-dvidspais123
星球大战剧本台词数据集StarWarsScriptsAllLinesDataset-dvidspais123 数据来源:互联网公开数据 标签:星球大战,剧本,台词,数据集,文本分析,电影研究,自然语言处理,影视作品 数据概述: 该数据集包含了星球大战系列电影的所有台词数据,记录了电影中的对话内容和角色信息。主要特征如下:... -
Reddit抑郁话题二分类数据集RedditDepressionBinaireDataset-doniabengaraali
Reddit抑郁话题二分类数据集RedditDepressionBinaireDataset-doniabengaraali 数据来源:互联网公开数据 标签:Reddit, 抑郁症, 二分类, 数据集, 自然语言处理, 机器学习, 社交媒体分析, 心理健康... -
网络平台仇恨言论数据集GNHateSpeechDataset-zohaibhasansiddiqui
网络平台仇恨言论数据集GNHateSpeechDataset-zohaibhasansiddiqui 数据来源:互联网公开数据 标签:仇恨言论,数据集,文本分析,社交媒体,自然语言处理,机器学习,数据分析,人工智能 数据概述: 该数据集包含来自网络平台的仇恨言论数据,记录了各类社交媒体平台上发布的内容。主要特征如下:... -
情绪识别社交媒体数据集EmosiDataset-SentimentAnalysisSocialMediaDataset-alfinashalya
情绪识别社交媒体数据集EmosiDataset-SentimentAnalysisSocialMediaDataset-alfinashalya 数据来源:互联网公开数据 标签:情绪识别,社交媒体,数据集,自然语言处理,机器学习,情感分析,文本挖掘,社交媒体分析... -
意图分类数据集IntentClassifierDataset-interviewturabit
意图分类数据集IntentClassifierDataset-interviewturabit 数据来源:互联网公开数据 标签:自然语言处理,意图识别,数据集,文本分类,机器学习,人工智能,对话系统,语义理解 数据概述: 该数据集包含用于意图分类任务的文本数据,旨在训练和评估文本分类模型,以识别用户输入文本的意图。主要特征如下:... -
网络欺凌检测数据集CyberbullyingDetectionDataset-sanzidasiddike3633
网络欺凌检测数据集CyberbullyingDetectionDataset-sanzidasiddike3633 数据来源:互联网公开数据 标签:网络欺凌,数据集,文本分析,自然语言处理,机器学习,情感分析,社交媒体,欺凌检测 数据概述: 该数据集包含来自社交媒体平台的文本数据,主要用于识别和分析网络欺凌行为。主要特征如下:... -
IMDB电影数据集IMDBMovieDataset-nadezhdadmitrieva
IMDB电影数据集IMDBMovieDataset-nadezhdadmitrieva 数据来源:互联网公开数据 标签:电影评价,数据集,情感分析,机器学习,自然语言处理,影评分析,大数据,数据挖掘 数据概述: 该数据集包含来自IMDB(互联网电影数据库)的电影评价数据,记录了用户对电影的评价和评分。主要特征如下:... -
越南假新闻检测数据集PhảnhồiBìnhLuận2017-goumanguyen
越南假新闻检测数据集PhảnhồiBìnhLuận2017-goumanguyen 数据来源:互联网公开数据 标签:假新闻,数据集,文本分析,自然语言处理,机器学习,信息诈骗,舆论监控,社会研究 数据概述: 该数据集包含来自越南“Phản hồi Bình Luận”平台的评论数据,记录了关于假新闻的文章及其评论。主要特征如下:... -
测试训练上下文大型语言模型数据集-quctngngvng
测试训练上下文大型语言模型数据集-quctngngvng 数据来源:互联网公开数据 标签:大型语言模型,数据集,自然语言处理,文本生成,机器学习,模型训练,语言模型,上下文学习 数据概述: 该数据集包含用于训练和评估大型语言模型(LLM)的文本数据,专注于测试训练(Test-Train)场景下的上下文学习能力。主要特征如下: 时间跨度:...