找到11,792个数据集

标签: 自然语言处理

过滤结果
  • 灾难事件推文数据集DisasterTweetsCleanedDataset-bkassem

    2025年4月26日   

    灾难事件推文数据集DisasterTweetsCleanedDataset-bkassem 数据来源:互联网公开数据 标签:社交媒体,灾害研究,数据集,自然语言处理,机器学习,情感分析,信息挖掘,应急响应 数据概述: 该数据集包含来自Twitter平台的灾难相关推文数据,记录了用户发布的与自然灾害,事故等灾难事件相关的文本内容。主要特征如下:...
    packageimg
  • 文本生成图像数据集-uppalapreetham

    2025年4月26日   

    文本生成图像数据集-uppalapreetham 数据来源:互联网公开数据 标签:图像生成,文本到图像,数据集,深度学习,计算机视觉,人工智能,图像处理,自然语言处理 数据概述: 该数据集包含了大量的文本描述和对应的图像,用于训练和评估文本生成图像模型。主要特征如下: 时间跨度: 数据记录的时间范围不固定,持续更新。 地理范围:...
    packageimg
  • 文本情感多分类数据集TextEmotionMulti-ClassificationDataset-magilc

    2025年4月26日   

    文本情感多分类数据集TextEmotionMulti-ClassificationDataset-magilc 数据来源:互联网公开数据 标签:情感分析,文本分类,数据集,自然语言处理,机器学习,情感识别,中文文本,多分类 数据概述: 该数据集包含大量的中文文本数据,标注了多种情感类别,用于文本情感多分类任务。主要特征如下:...
    packageimg
  • 亚马逊小说数据集AmazonNovelsDataset-maryngembu

    2025年4月26日   

    亚马逊小说数据集AmazonNovelsDataset-maryngembu 数据来源:互联网公开数据 标签:小说,数据集,文学,亚马逊,文本分析,自然语言处理,情感分析,书籍 数据概述: 该数据集包含了来自亚马逊平台的小说数据,记录了大量书籍的详细信息。主要特征如下: 时间跨度:数据记录的时间范围涵盖了近年来在亚马逊平台上发布的小说。...
    packageimg
  • 电影准确分类数据集2023年电影准确分类数据集-benjaminmissaoui

    2025年4月26日   

    电影准确分类数据集2023年电影准确分类数据集-benjaminmissaoui 数据来源:互联网公开数据 标签:电影分类,数据集,准确分类,电影推荐,机器学习,自然语言处理,文本分析,娱乐产业 数据概述: 该数据集包含来自多个来源的电影数据,记录了电影的详细信息及其准确的分类。主要特征如下: 时间跨度:数据记录的时间范围从2000年到2023年。...
    packageimg
  • 亚马逊分类产品评论数据集AmazonCategoryWiseProductReviewsDataset-sreevanidanthojue

    2025年4月26日   

    亚马逊分类产品评论数据集AmazonCategoryWiseProductReviewsDataset-sreevanidanthojue 数据来源:互联网公开数据 标签:亚马逊,产品评论,数据集,分类分析,自然语言处理,电子商务,消费者行为,市场研究 数据概述:该数据集包含来自亚马逊平台的产品评论数据,按不同商品类别分类。主要特征如下:...
    packageimg
  • 俚语数据集SlangDataDataset-jhyunkim

    2025年4月26日   

    俚语数据集SlangDataDataset-jhyunkim 数据来源:互联网公开数据 标签:俚语,语言学,数据集,文本分析,自然语言处理,社交媒体,文化研究,词汇学 数据概述: 该数据集包含了大量来自互联网的俚语数据,旨在用于语言学研究,文本分析和自然语言处理等领域。主要特征如下:...
    packageimg
  • 仅英文MT5翻译数据集OnlyEnglishMT5TranslationDataset-parthplc

    2025年4月26日   

    仅英文MT5翻译数据集OnlyEnglishMT5TranslationDataset-parthplc 数据来源:互联网公开数据 标签:机器翻译,数据集,文本翻译,自然语言处理,英语,多语言,深度学习,NLP 数据概述: 该数据集包含了用于训练和评估多语言翻译模型(MT5)的英语翻译数据,专注于英语与其他语言之间的翻译。主要特征如下:...
    packageimg
  • 假新闻与真新闻数据集2016-2020年中国新闻数据集-ramaqubra

    2025年4月26日   

    假新闻与真新闻数据集2016-2020年中国新闻数据集-ramaqubra 数据来源:互联网公开数据 标签:新闻数据集,假新闻识别,数据集,信息真实性,自然语言处理,机器学习,社会研究,媒体分析 数据概述:该数据集包含来自互联网上不同来源的新闻数据,记录了2016年至2020年中国范围内的假新闻和真新闻。主要特征如下:...
    packageimg
  • 社交媒体情感分析测试数据集SODIC-NLPTestLabelvDataset-yaomllu

    2025年4月26日   

    社交媒体情感分析测试数据集SODIC-NLPTestLabelvDataset-yaomllu 数据来源:互联网公开数据 标签:自然语言处理,情感分析,数据集,文本分类,社交媒体,机器学习,NLP,中文 数据概述: 该数据集是SODIC-NLP项目的一部分,旨在测试和评估中文情感分析模型的性能。主要特征如下:...
    packageimg
  • 无词干提取文本数据集DatasetTanpaStemming-skripsheet

    2025年4月26日   

    无词干提取文本数据集DatasetTanpaStemming-skripsheet 数据来源:互联网公开数据 标签:文本分析,数据集,自然语言处理,机器学习,文本处理,信息检索,语言技术,数据分析 数据概述: 该数据集包含未进行词干提取处理的文本数据,记录了原始文本的完整形态。主要特征如下: 时间跨度:...
    packageimg
  • 产品评论数据集ProductReviewDataset-irtiqaamin

    2025年4月26日   

    产品评论数据集ProductReviewDataset-irtiqaamin 数据来源:互联网公开数据 标签:产品评论,数据集,自然语言处理,情感分析,机器学习,电子商务,消费者行为,数据挖掘 数据概述: 该数据集包含来自多个电子商务平台的产品评论数据,记录了消费者对不同产品的评价和反馈。主要特征如下:...
    packageimg
  • 医院电子病历表格数据集ELO-TablesDataset-felixneumann

    2025年4月26日   

    医院电子病历表格数据集ELO-TablesDataset-felixneumann 数据来源:互联网公开数据 标签:电子病历,数据集,医疗信息,表格识别,自然语言处理,医疗研究,人工智能,健康数据 数据概述: 该数据集包含来自医院的电子病历表格数据,记录了患者的诊断,治疗和其他医疗信息。主要特征如下: 时间跨度:...
    packageimg
  • 维基百科证据数据集WikipediaEvidenceDataset-kaggleqrdl

    2025年4月26日   

    维基百科证据数据集WikipediaEvidenceDataset-kaggleqrdl 数据来源:互联网公开数据 标签:维基百科,证据,数据集,自然语言处理,信息抽取,文本分析,机器学习,知识图谱 数据概述: 该数据集包含来自维基百科的文章及其引用的证据,旨在支持证据推理和事实核查任务。主要特征如下:...
    packageimg
  • 黑客新闻帖子数据集HackerNewsPostsDataset-abiyyuhrusin

    2025年4月26日   

    黑客新闻帖子数据集HackerNewsPostsDataset-abiyyuhrusin 数据来源:互联网公开数据 标签:黑客新闻,数据集,社交媒体,技术新闻,用户行为,数据分析,机器学习,自然语言处理 数据概述:该数据集包含来自 Hacker News 的帖子数据,记录了该网站上发布的各种技术新闻和讨论帖的详细信息。主要特征如下:...
    packageimg
  • 常用语音台湾普通话翻译数据集CommonVoiceNanTWTranslatedDataset-yuweiiizz

    2025年4月26日   

    常用语音台湾普通话翻译数据集CommonVoiceNanTWTranslatedDataset-yuweiiizz 数据来源:互联网公开数据 标签:语音数据,数据集,自然语言处理,机器学习,语音识别,翻译,人工智能,台湾普通话 数据概述:该数据集包含来自Mozilla Common...
    packageimg
  • 雅思写作数据集IELTSWritingDataset-sebasga79

    2025年4月26日   

    雅思写作数据集IELTSWritingDataset-sebasga79 数据来源:互联网公开数据 标签:雅思,写作,数据集,英语学习,语言分析,教育评估,自然语言处理,学术研究 数据概述:该数据集包含来自雅思考试写作部分的数据,记录了考生的写作样本及其评分。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。...
    packageimg
  • 谷歌评价数据集GoogleReviewDataset-sharmau0091

    2025年4月26日   

    谷歌评价数据集GoogleReviewDataset-sharmau0091 数据来源:互联网公开数据 标签:谷歌评价,数据集,文本分析,自然语言处理,消费者反馈,数据分析,商业智能,机器学习 数据概述:该数据集包含来自谷歌搜索平台的用户评价数据,记录了用户对各种产品和服务的评价信息。主要特征如下:...
    packageimg
  • JigsawTPU验证与测试数据翻译数据集JigsawTPUValidationandTestDataTranslatedDataset-ma7555

    2025年4月26日   

    JigsawTPU验证与测试数据翻译数据集JigsawTPUValidationandTestDataTranslatedDataset-ma7555 数据来源:互联网公开数据 标签:自然语言处理,机器翻译,数据集,文本分类,深度学习,数据验证,人工智能,语言模型 数据概述: 该数据集包含来自 Jigsaw 项目的数据,记录了用于验证和测试...
    packageimg
  • 网络欺凌文本数据集-rohansandipborhade

    2025年4月26日   

    网络欺凌文本数据集-rohansandipborhade 数据来源:互联网公开数据 标签:网络欺凌,文本数据,情感分析,自然语言处理,欺凌检测,社交媒体,数据集,恶意内容 数据概述: 该数据集包含了关于网络欺凌行为的文本数据,旨在用于研究和开发自动检测和分析网络欺凌的工具。主要特征如下: 时间跨度:...
    packageimg