-
灾难事件推文数据集DisasterTweetsCleanedDataset-bkassem
灾难事件推文数据集DisasterTweetsCleanedDataset-bkassem 数据来源:互联网公开数据 标签:社交媒体,灾害研究,数据集,自然语言处理,机器学习,情感分析,信息挖掘,应急响应 数据概述: 该数据集包含来自Twitter平台的灾难相关推文数据,记录了用户发布的与自然灾害,事故等灾难事件相关的文本内容。主要特征如下:... -
文本生成图像数据集-uppalapreetham
文本生成图像数据集-uppalapreetham 数据来源:互联网公开数据 标签:图像生成,文本到图像,数据集,深度学习,计算机视觉,人工智能,图像处理,自然语言处理 数据概述: 该数据集包含了大量的文本描述和对应的图像,用于训练和评估文本生成图像模型。主要特征如下: 时间跨度: 数据记录的时间范围不固定,持续更新。 地理范围:... -
文本情感多分类数据集TextEmotionMulti-ClassificationDataset-magilc
文本情感多分类数据集TextEmotionMulti-ClassificationDataset-magilc 数据来源:互联网公开数据 标签:情感分析,文本分类,数据集,自然语言处理,机器学习,情感识别,中文文本,多分类 数据概述: 该数据集包含大量的中文文本数据,标注了多种情感类别,用于文本情感多分类任务。主要特征如下:... -
亚马逊小说数据集AmazonNovelsDataset-maryngembu
亚马逊小说数据集AmazonNovelsDataset-maryngembu 数据来源:互联网公开数据 标签:小说,数据集,文学,亚马逊,文本分析,自然语言处理,情感分析,书籍 数据概述: 该数据集包含了来自亚马逊平台的小说数据,记录了大量书籍的详细信息。主要特征如下: 时间跨度:数据记录的时间范围涵盖了近年来在亚马逊平台上发布的小说。... -
电影准确分类数据集2023年电影准确分类数据集-benjaminmissaoui
电影准确分类数据集2023年电影准确分类数据集-benjaminmissaoui 数据来源:互联网公开数据 标签:电影分类,数据集,准确分类,电影推荐,机器学习,自然语言处理,文本分析,娱乐产业 数据概述: 该数据集包含来自多个来源的电影数据,记录了电影的详细信息及其准确的分类。主要特征如下: 时间跨度:数据记录的时间范围从2000年到2023年。... -
亚马逊分类产品评论数据集AmazonCategoryWiseProductReviewsDataset-sreevanidanthojue
亚马逊分类产品评论数据集AmazonCategoryWiseProductReviewsDataset-sreevanidanthojue 数据来源:互联网公开数据 标签:亚马逊,产品评论,数据集,分类分析,自然语言处理,电子商务,消费者行为,市场研究 数据概述:该数据集包含来自亚马逊平台的产品评论数据,按不同商品类别分类。主要特征如下:... -
俚语数据集SlangDataDataset-jhyunkim
俚语数据集SlangDataDataset-jhyunkim 数据来源:互联网公开数据 标签:俚语,语言学,数据集,文本分析,自然语言处理,社交媒体,文化研究,词汇学 数据概述: 该数据集包含了大量来自互联网的俚语数据,旨在用于语言学研究,文本分析和自然语言处理等领域。主要特征如下:... -
仅英文MT5翻译数据集OnlyEnglishMT5TranslationDataset-parthplc
仅英文MT5翻译数据集OnlyEnglishMT5TranslationDataset-parthplc 数据来源:互联网公开数据 标签:机器翻译,数据集,文本翻译,自然语言处理,英语,多语言,深度学习,NLP 数据概述: 该数据集包含了用于训练和评估多语言翻译模型(MT5)的英语翻译数据,专注于英语与其他语言之间的翻译。主要特征如下:... -
假新闻与真新闻数据集2016-2020年中国新闻数据集-ramaqubra
假新闻与真新闻数据集2016-2020年中国新闻数据集-ramaqubra 数据来源:互联网公开数据 标签:新闻数据集,假新闻识别,数据集,信息真实性,自然语言处理,机器学习,社会研究,媒体分析 数据概述:该数据集包含来自互联网上不同来源的新闻数据,记录了2016年至2020年中国范围内的假新闻和真新闻。主要特征如下:... -
社交媒体情感分析测试数据集SODIC-NLPTestLabelvDataset-yaomllu
社交媒体情感分析测试数据集SODIC-NLPTestLabelvDataset-yaomllu 数据来源:互联网公开数据 标签:自然语言处理,情感分析,数据集,文本分类,社交媒体,机器学习,NLP,中文 数据概述: 该数据集是SODIC-NLP项目的一部分,旨在测试和评估中文情感分析模型的性能。主要特征如下:... -
无词干提取文本数据集DatasetTanpaStemming-skripsheet
无词干提取文本数据集DatasetTanpaStemming-skripsheet 数据来源:互联网公开数据 标签:文本分析,数据集,自然语言处理,机器学习,文本处理,信息检索,语言技术,数据分析 数据概述: 该数据集包含未进行词干提取处理的文本数据,记录了原始文本的完整形态。主要特征如下: 时间跨度:... -
产品评论数据集ProductReviewDataset-irtiqaamin
产品评论数据集ProductReviewDataset-irtiqaamin 数据来源:互联网公开数据 标签:产品评论,数据集,自然语言处理,情感分析,机器学习,电子商务,消费者行为,数据挖掘 数据概述: 该数据集包含来自多个电子商务平台的产品评论数据,记录了消费者对不同产品的评价和反馈。主要特征如下:... -
医院电子病历表格数据集ELO-TablesDataset-felixneumann
医院电子病历表格数据集ELO-TablesDataset-felixneumann 数据来源:互联网公开数据 标签:电子病历,数据集,医疗信息,表格识别,自然语言处理,医疗研究,人工智能,健康数据 数据概述: 该数据集包含来自医院的电子病历表格数据,记录了患者的诊断,治疗和其他医疗信息。主要特征如下: 时间跨度:... -
维基百科证据数据集WikipediaEvidenceDataset-kaggleqrdl
维基百科证据数据集WikipediaEvidenceDataset-kaggleqrdl 数据来源:互联网公开数据 标签:维基百科,证据,数据集,自然语言处理,信息抽取,文本分析,机器学习,知识图谱 数据概述: 该数据集包含来自维基百科的文章及其引用的证据,旨在支持证据推理和事实核查任务。主要特征如下:... -
黑客新闻帖子数据集HackerNewsPostsDataset-abiyyuhrusin
黑客新闻帖子数据集HackerNewsPostsDataset-abiyyuhrusin 数据来源:互联网公开数据 标签:黑客新闻,数据集,社交媒体,技术新闻,用户行为,数据分析,机器学习,自然语言处理 数据概述:该数据集包含来自 Hacker News 的帖子数据,记录了该网站上发布的各种技术新闻和讨论帖的详细信息。主要特征如下:... -
常用语音台湾普通话翻译数据集CommonVoiceNanTWTranslatedDataset-yuweiiizz
常用语音台湾普通话翻译数据集CommonVoiceNanTWTranslatedDataset-yuweiiizz 数据来源:互联网公开数据 标签:语音数据,数据集,自然语言处理,机器学习,语音识别,翻译,人工智能,台湾普通话 数据概述:该数据集包含来自Mozilla Common... -
雅思写作数据集IELTSWritingDataset-sebasga79
雅思写作数据集IELTSWritingDataset-sebasga79 数据来源:互联网公开数据 标签:雅思,写作,数据集,英语学习,语言分析,教育评估,自然语言处理,学术研究 数据概述:该数据集包含来自雅思考试写作部分的数据,记录了考生的写作样本及其评分。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。... -
谷歌评价数据集GoogleReviewDataset-sharmau0091
谷歌评价数据集GoogleReviewDataset-sharmau0091 数据来源:互联网公开数据 标签:谷歌评价,数据集,文本分析,自然语言处理,消费者反馈,数据分析,商业智能,机器学习 数据概述:该数据集包含来自谷歌搜索平台的用户评价数据,记录了用户对各种产品和服务的评价信息。主要特征如下:... -
JigsawTPU验证与测试数据翻译数据集JigsawTPUValidationandTestDataTranslatedDataset-ma7555
JigsawTPU验证与测试数据翻译数据集JigsawTPUValidationandTestDataTranslatedDataset-ma7555 数据来源:互联网公开数据 标签:自然语言处理,机器翻译,数据集,文本分类,深度学习,数据验证,人工智能,语言模型 数据概述: 该数据集包含来自 Jigsaw 项目的数据,记录了用于验证和测试... -
网络欺凌文本数据集-rohansandipborhade
网络欺凌文本数据集-rohansandipborhade 数据来源:互联网公开数据 标签:网络欺凌,文本数据,情感分析,自然语言处理,欺凌检测,社交媒体,数据集,恶意内容 数据概述: 该数据集包含了关于网络欺凌行为的文本数据,旨在用于研究和开发自动检测和分析网络欺凌的工具。主要特征如下: 时间跨度:...