-
意图识别数据集IntentRecognitionDataset-himanshunayal
意图识别数据集IntentRecognitionDataset-himanshunayal 数据来源:互联网公开数据 标签:自然语言处理,意图识别,数据集,文本分类,机器学习,对话系统,情感分析,语义理解,人工智能 数据概述: 该数据集包含了用于意图识别任务的文本数据,旨在训练和评估自然语言处理模型对用户输入的意图进行准确分类。主要特征如下:... -
书籍文本错误纠正数据集-shuaibing
书籍文本错误纠正数据集-shuaibing 数据来源:互联网公开数据 标签:文本纠错,自然语言处理,数据集,机器学习,文本校对,语言模型,文本处理,错误检测 数据概述: 该数据集包含书籍文本及其对应的校正后文本,用于训练和评估文本错误纠正模型。主要特征如下: 时间跨度:数据记录的时间跨度涵盖了不同时期出版的书籍。... -
英语-德语翻译数据集English-to-GermanTranslationDataset-shashanknecrothapa
英语-德语翻译数据集English-to-GermanTranslationDataset-shashanknecrothapa 数据来源:互联网公开数据 标签:机器翻译,语言学习,数据集,自然语言处理,人工智能,双语对照,文本处理,教育应用 数据概述: 该数据集包含英语到德语的文本翻译对,记录了大量的英语句子及其对应的德语翻译。主要特征如下:... -
约翰尼-迪普与安伯-赫德推特数据集JohnnyDeppandAmberHeardTwitterDataset-lukegroves
约翰尼-迪普与安伯-赫德推特数据集JohnnyDeppandAmberHeardTwitterDataset-lukegroves 数据来源:互联网公开数据 标签:社交媒体,推特,公众人物,情感分析,社会影响,数据集,自然语言处理,舆论研究... -
IMDB电影评论情感分析数据集IMDBMoviesSentimentDataset-hrishikeshpable
IMDB电影评论情感分析数据集IMDBMoviesSentimentDataset-hrishikeshpable 数据来源:互联网公开数据 标签:情感分析,电影评论,数据集,自然语言处理,机器学习,文本分析,数据挖掘,AI应用 数据概述: 该数据集包含来自IMDB(互联网电影数据库)的电影评论数据,记录了观众对电影的主观评价和情感倾向。主要特征如下:... -
独特推文数据集UniqueTweetsDataset-wenxindong
独特推文数据集UniqueTweetsDataset-wenxindong 数据来源:互联网公开数据 标签:社交媒体,数据集,文本分析,自然语言处理,机器学习,信息挖掘,舆情分析,网络传播 数据概述: 该数据集包含来自社交媒体平台推文的独特内容,记录了用户的原创推文及其相关信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。... -
波士顿咨询公司BCG人工审核清洗数据集BCGManuallyReviewed-CleanedDataset-didizlatkova
波士顿咨询公司BCG人工审核清洗数据集BCGManuallyReviewed-CleanedDataset-didizlatkova 数据来源:互联网公开数据 标签:商业咨询,数据集,文本分析,自然语言处理,数据清洗,人工审核,市场调研,客户反馈 数据概述:... -
虚假新闻内容检测数据集FakeNewsContentDetectionDataset-ganeshmg
虚假新闻内容检测数据集FakeNewsContentDetectionDataset-ganeshmg 数据来源:互联网公开数据 标签:新闻检测,数据集,自然语言处理,内容分析,机器学习,虚假信息,新闻传播,人工智能 数据概述: 该数据集包含来自互联网公开渠道的虚假新闻内容数据,记录了新闻文本及其标签信息。主要特征如下:... -
英语与印地语混合语料数据集HinglishDataset-saahir2629
英语与印地语混合语料数据集HinglishDataset-saahir2629 数据来源:互联网公开数据 标签:语言研究,自然语言处理,数据集,双语语料,机器学习,语言模型,社会语言学,计算机科学 数据概述: 该数据集包含英语与印地语混合使用的文本数据,记录了在社交媒体,在线聊天和日常交流中广泛使用的Hinglish语言现象。主要特征如下:... -
YouTube评论垃圾信息分类数据集YouTubeSpamCollectionDataset-hinxcode
YouTube评论垃圾信息分类数据集YouTubeSpamCollectionDataset-hinxcode 数据来源:互联网公开数据 标签:垃圾信息识别,数据集,机器学习,自然语言处理,评论分析,社交媒体,文本分类,内容审核 数据概述:... -
教育安卓应用情感分析数据集SentimentAnalysisforEducationAndroidAppsDataset-kanwalzahoor
教育安卓应用情感分析数据集SentimentAnalysisforEducationAndroidAppsDataset-kanwalzahoor 数据来源:互联网公开数据 标签:情感分析,安卓应用,数据集,教育应用,用户评价,自然语言处理,机器学习,应用评估 数据概述:... -
航空公司推文情感分析数据集SentimentAnalysisAirlineTweetsDataset-aspnet222
航空公司推文情感分析数据集SentimentAnalysisAirlineTweetsDataset-aspnet222 数据来源:互联网公开数据 标签:情感分析,航空公司,社交媒体,数据集,文本分析,机器学习,自然语言处理,客户服务 数据概述: 该数据集包含来自航空公司的推文数据,记录了用户对航空服务的情感反馈。主要特征如下:... -
代码注入漏洞检测数据集CodeInjectionVulnerabilityDetectionDataset-natasa213
代码注入漏洞检测数据集CodeInjectionVulnerabilityDetectionDataset-natasa213 数据来源:互联网公开数据 标签:代码安全,漏洞检测,数据集,机器学习,自然语言处理,软件工程,安全分析,恶意代码 数据概述:该数据集包含用于代码注入漏洞检测的数据,记录了不同编程语言(如 Python,Java,PHP... -
金融自然语言处理数据集FinnLPDatav2-金融自然语言处理数据集-coder2303
金融自然语言处理数据集FinnLPDatav2-金融自然语言处理数据集-coder2303 数据来源:互联网公开数据 标签:金融自然语言处理,数据集,文本分析,机器学习,自然语言处理,金融分析,情绪分析,文本挖掘 数据概述:... -
城市网络社交媒体评论情感分析数据集CityNetInstagramCommentsSentimentAnalysisDataset-vrashad
城市网络社交媒体评论情感分析数据集CityNetInstagramCommentsSentimentAnalysisDataset-vrashad 数据来源:互联网公开数据 标签:社交媒体,情感分析,数据集,文本挖掘,机器学习,情感识别,自然语言处理,城市研究 数据概述:... -
大规模通用文本数据集LLM-Text-Data-abramova
大规模通用文本数据集LLM-Text-Data-abramova 数据来源:互联网公开数据 标签:文本数据,自然语言处理,大型语言模型,数据集,文本分析,机器学习,数据挖掘,通用领域 数据概述:该数据集包含了大规模的通用文本数据,旨在支持大型语言模型(LLM)的训练,评估和研究。主要特征如下:... -
推特私信数据集TwitterDMDataset-jiayu991011
推特私信数据集TwitterDMDataset-jiayu991011 数据来源:互联网公开数据 标签:推特,私信,社交媒体,自然语言处理,文本分析,情感分析,数据集,用户行为 数据概述: 该数据集包含来自推特(Twitter)的私信数据,记录了用户之间的私信内容和相关信息。主要特征如下:... -
无TF-IDF主题分析数据集NoTF-IDFTopicAnalysisDataset-sylviayan147
无TF-IDF主题分析数据集NoTF-IDFTopicAnalysisDataset-sylviayan147 数据来源:互联网公开数据 标签:主题分析,数据集,文本挖掘,自然语言处理,文本分类,机器学习,数据分析,信息检索 数据概述: 该数据集包含来自公开互联网资源的文本数据,记录了不使用TF-IDF方法进行主题分析的文本样本。主要特征如下:... -
疾病诊断标签清洗数据集-vasanth5794
疾病诊断标签清洗数据集-vasanth5794 数据来源:互联网公开数据 标签:医学诊断,数据集,标签清洗,数据预处理,自然语言处理,机器学习,医疗健康,数据质量 数据概述: 该数据集包含经过清洗和整理的疾病诊断标签数据,旨在用于医学诊断相关的研究和应用。主要特征如下: 时间跨度:数据记录的时间范围不明确,取决于原始数据的收集时间。... -
莱特币NLP挑战赛第一部分数据集LitecoinNLPChallengePart1Dataset-dschettler8845
莱特币NLP挑战赛第一部分数据集LitecoinNLPChallengePart1Dataset-dschettler8845 数据来源:互联网公开数据 标签:莱特币,自然语言处理,数据集,文本分析,金融科技,加密货币,情感分析,机器学习 数据概述:...