-
通用英语语法纠错数据集GeneralEnglishCorrectionDataset-ajoydey00001
通用英语语法纠错数据集GeneralEnglishCorrectionDataset-ajoydey00001 数据来源:互联网公开数据 标签:自然语言处理,语法纠错,数据集,机器学习,文本分析,教育技术,语言处理,智能写作 数据概述: 该数据集专注于英语语法纠错任务,包含大量英语文本及其对应的语法错误标注和修正建议。主要特征如下:... -
新闻文章情感分析数据集NewPreprocessedNewsArticlesSentimentAnalysisDataset-zeuss2k3
新闻文章情感分析数据集NewPreprocessedNewsArticlesSentimentAnalysisDataset-zeuss2k3 数据来源:互联网公开数据 标签:情感分析,新闻文章,数据集,自然语言处理,机器学习,文本分析,情感分类,中文 数据概述: 该数据集包含预处理过的新闻文章数据,旨在用于情感分析任务。主要特征如下:... -
虚假新闻检测数据集GottobeFakeData-nikhilkottoli
虚假新闻检测数据集GottobeFakeData-nikhilkottoli 数据来源:互联网公开数据 标签:虚假新闻,数据集,自然语言处理,文本分析,机器学习,信息检索,新闻媒体,谣言识别 数据概述: 该数据集包含用于虚假新闻检测的数据,记录了新闻文章的真实性标签和相关文本内容。主要特征如下:... -
聊天数据集ChatDataDataset-kundansingh08
聊天数据集ChatDataDataset-kundansingh08 数据来源:互联网公开数据 标签:聊天数据,数据集,自然语言处理,机器学习,对话系统,文本分析,社交媒体,人工智能 数据概述: 该数据集包含来自多种社交媒体平台的聊天记录数据,记录了用户之间的对话内容。主要特征如下: 时间跨度: 数据记录的时间范围从2019年到2022年。 地理范围:... -
电商平台商品信息数据集E-commercePlatformProductInformation-saikrupar
电商平台商品信息数据集E-commercePlatformProductInformation-saikrupar 数据来源:互联网公开数据 标签:电商, 商品信息, 文本分析, 市场分析, 数据挖掘, 商品推荐, 零售, 数据集 数据概述: 该数据集包含来自电商平台上的商品信息,记录了商品的详细描述、分类、价格等关键属性。主要特征如下:... -
语言流畅度评估模型训练数据集LanguageFluencyAssessmentModelTrainingDataset-liuhuohuo
语言流畅度评估模型训练数据集LanguageFluencyAssessmentModelTrainingDataset-liuhuohuo 数据来源:互联网公开数据 标签:语言评估, 文本分析, 机器学习, 自然语言处理, 文本流畅度, 深度学习, 情感分析, 文本生成 数据概述: 该数据集包含基于ALBERT-... -
医疗问答知识库标注数据集MedicalQuestionAnsweringKnowledgeBaseAnnotationDataset-sriramgugulothu
医疗问答知识库标注数据集MedicalQuestionAnsweringKnowledgeBaseAnnotationDataset-sriramgugulothu 数据来源:互联网公开数据 标签:医疗健康, 问答系统, 知识图谱, 数据标注, 自然语言处理, 文本分析, 语义理解, 医疗信息 数据概述:... -
论文评审与关键词分析数据集PaperReviewandKeywordAnalysisDataset-devanshpatel22
论文评审与关键词分析数据集PaperReviewandKeywordAnalysisDataset-devanshpatel22 数据来源:互联网公开数据 标签:论文评审, 关键词提取, 自然语言处理, 学术研究, 文本分析, 机器学习, 专家评价, 模型评估 数据概述:... -
幽默笑话语料库分析数据集HumorJokeCorpusAnalysis-wilmernystrm
幽默笑话语料库分析数据集HumorJokeCorpusAnalysis-wilmernystrm 数据来源:互联网公开数据 标签:幽默, 笑话, 文本分析, 情感分析, 自然语言处理, 社交媒体, 语料库, 数据挖掘 数据概述: 该数据集包含来自Reddit等社交媒体平台的幽默笑话语料,记录了各种类型和主题的笑话文本及其相关元数据。主要特征如下:... -
葡萄酒品鉴评论文本数据集WineTastingReviewTextDataset-statiana
葡萄酒品鉴评论文本数据集WineTastingReviewTextDataset-statiana 数据来源:互联网公开数据 标签:葡萄酒, 品鉴, 评论, 文本分析, 自然语言处理, 多语言, 情感分析, 数据标注 数据概述: 该数据集包含来自多个来源的葡萄酒品鉴评论文本,记录了不同年份、不同葡萄酒的品鉴笔记。主要特征如下:... -
vk笑话数据集VKAnecdotesDataset-boogiewoogieqq
vk笑话数据集VKAnecdotesDataset-boogiewoogieqq 数据来源:互联网公开数据 标签:社交媒体,文本分析,数据集,自然语言处理,情感分析,机器学习,文本挖掘,娱乐内容 数据概述: 该数据集包含来自vk社交平台(vk.com)的笑话和幽默内容数据,记录了用户分享的笑话文本及部分相关信息。主要特征如下:... -
文本摘要多方法评估数据集TextSummarizationMulti-methodEvaluationDataset-arousrihab
文本摘要多方法评估数据集TextSummarizationMulti-methodEvaluationDataset-arousrihab 数据来源:互联网公开数据 标签:文本摘要, 自然语言处理, 摘要生成, 评估, 机器学习, 深度学习, 摘要模型, 文本分析 数据概述:... -
音乐歌词数据集Dataset-Lyrics-Musics-italomarcelo
音乐歌词数据集Dataset-Lyrics-Musics-italomarcelo 数据来源:互联网公开数据 标签:音乐,歌词,数据集,文本分析,自然语言处理,音乐分析,情感分析,数据挖掘 数据概述: 该数据集包含来自多个音乐平台和公开来源的音乐歌词数据,记录了不同歌曲的歌词文本及相关信息。主要特征如下:... -
Twitter大规模自然语言处理数据集2015年至今超过1500万条推文-sourabhkumarsantra
Twitter大规模自然语言处理数据集2015年至今超过1500万条推文-sourabhkumarsantra 数据来源:互联网公开数据 标签:社交媒体,自然语言处理,数据集,文本分析,机器学习,情感分析,数据挖掘,文本分类 数据概述:... -
堤坝巡逻文本数据集DamPatrolTextCorpus-tunphmnguynanh
堤坝巡逻文本数据集DamPatrolTextCorpus-tunphmnguynanh 数据来源:互联网公开数据 标签:堤坝, 巡逻, 防洪, 文本, 法律法规, 自然语言处理, 文本分析, 越南语 数据概述: 该数据集包含来自越南官方文件的文本数据,记录了关于堤坝巡逻和防洪的相关规定和说明。主要特征如下:... -
俄罗斯社交媒体内容分析数据集RussiaSocialMediaContentAnalysis-dawndarasms
俄罗斯社交媒体内容分析数据集RussiaSocialMediaContentAnalysis-dawndarasms 数据来源:互联网公开数据 标签:社交媒体, 文本分析, 俄罗斯, 内容分析, 舆情监测, 政治传播, 语言识别, 数据挖掘 数据概述: 该数据集包含来自社交媒体平台的数据,记录了与俄罗斯相关的社交媒体内容。主要特征如下:... -
比特币论坛讨论数据r-Bitcoin2010年9月至2022年6月数据集-jonathong
比特币论坛讨论数据r-Bitcoin2010年9月至2022年6月数据集-jonathong 数据来源:互联网公开数据 标签:比特币,论坛,数据,区块链,加密货币,社区,文本分析,情感分析 数据概述:该数据集包含来自Reddit论坛 r/Bitcoin... -
新闻摘要生成数据集NewsSummarizationDataset-moatazsaleh
新闻摘要生成数据集NewsSummarizationDataset-moatazsaleh 数据来源:互联网公开数据 标签:文本摘要, 自然语言处理, 新闻文章, 机器翻译, 深度学习, 文本分析, 语料库, 摘要生成 数据概述: 该数据集包含预处理过的新闻文章及其对应的摘要,用于训练和评估文本摘要模型。主要特征如下:... -
标题:Samthemar 输出总结数据集(Samthemar Outputs Summarization Dataset)
标题:Samthemar 输出总结数据集(Samthemar Outputs Summarization Dataset) 数据来源:互联网公开数据 标签:文本摘要,数据集,自然语言处理,机器学习,信息检索,文本分析,深度学习,总结 数据概述:该数据集包含来自Samthemar项目的输出总结数据,记录了各种文本的摘要信息。主要特征如下:... -
图像商品描述数据集ImageProductDescription-antonious512
图像商品描述数据集ImageProductDescription-antonious512 数据来源:互联网公开数据 标签:商品描述, 图像识别, 电商, 文本分析, 数据集, 图像, 商品, 深度学习 数据概述: 该数据集包含来自电商平台的商品信息,记录了商品的名称与对应的图像。主要特征如下:...