找到11,679个数据集

标签: 自然语言处理

过滤结果
  • Kickstarter项目评论数据集-alonsopuente

    2025年5月30日   

    Kickstarter项目评论数据集-alonsopuente 数据来源:互联网公开数据 标签:众筹,Kickstarter,评论数据,文本分析,情感分析,自然语言处理,项目评估,社交媒体 数据概述: 该数据集包含来自Kickstarter平台的项目评论数据,记录了用户对众筹项目的反馈和评价。主要特征如下:...
    packageimg
  • 扎罗人工智能2021法律文本检索数据集ZaloAI2021LegalTextRetrievalDataset-hariwh0

    2025年5月30日   

    扎罗人工智能2021法律文本检索数据集ZaloAI2021LegalTextRetrievalDataset-hariwh0 数据来源:互联网公开数据 标签:法律文本,检索,自然语言处理,数据集,信息检索,语义匹配,越南语,人工智能 数据概述: 该数据集由扎罗人工智能(Zalo...
    packageimg
  • 多语言电影评论数据集MultilingualReviewsDataset-ishaanthanekar

    2025年5月30日   

    多语言电影评论数据集MultilingualReviewsDataset-ishaanthanekar 数据来源:互联网公开数据 标签:电影评论,多语言,情感分析,自然语言处理,机器学习,文本分析,情感分类,数据集 数据概述: 该数据集包含了来自多个语言的电影评论数据,旨在用于情感分析和多语言文本处理任务。主要特征如下: 时间跨度:...
    packageimg
  • 社交媒体用户情感分析训练数据集SocialMediaUserSentimentAnalysisTrainingDataset-a0049228b

    2025年5月30日   

    社交媒体用户情感分析训练数据集SocialMediaUserSentimentAnalysisTrainingDataset-a0049228b 数据来源:互联网公开数据 标签:情感分析, 社交媒体, 文本分类, 自然语言处理, 情感极性, 用户情绪, 数据标注, 机器学习 数据概述:...
    packageimg
  • 多模态图像文本描述生成数据集MultimodalImage-TextDescriptionGenerationDataset-yutaroatarashi

    2025年5月30日   

    多模态图像文本描述生成数据集MultimodalImage-TextDescriptionGenerationDataset-yutaroatarashi 数据来源:互联网公开数据 标签:图像描述, 文本生成, 多模态学习, 视觉语言, 图像标注, 自然语言处理, 机器翻译, 数据集构建 数据概述:...
    packageimg
  • 垃圾邮件与非垃圾邮件分类数据集Group5Spam-HamMailsDataset-ashishgoraniya

    2025年5月30日   

    垃圾邮件与非垃圾邮件分类数据集Group5Spam-HamMailsDataset-ashishgoraniya 数据来源:互联网公开数据 标签:邮件分类,垃圾邮件检测,数据集,文本分析,机器学习,自然语言处理,信息安全,数据挖掘 数据概述:...
    packageimg
  • 电影类型与剧情分析数据集MovieGenresandPlotAnalysis-vijethrai

    2025年5月30日   

    电影类型与剧情分析数据集MovieGenresandPlotAnalysis-vijethrai 数据来源:互联网公开数据 标签:电影分析, 电影类型, 剧情摘要, 文本分类, 多标签分类, 电影推荐, 自然语言处理, 数据集 数据概述: 该数据集包含来自电影数据库的电影信息,记录了电影的标题、剧情摘要及其对应的类型标签。主要特征如下:...
    packageimg
  • 用户界面测试智能手机反馈数据集UITestSmartphoneFeedbackDataset-phunggiahuy

    2025年5月30日   

    用户界面测试智能手机反馈数据集UITestSmartphoneFeedbackDataset-phunggiahuy 数据来源:互联网公开数据 标签:智能手机,用户反馈,用户界面,用户体验,自然语言处理,情感分析,数据集,移动应用 数据概述:...
    packageimg
  • 情绪识别数据集Sad-Happy-AngryEmotionRecognitionDataset-michaeloster

    2025年5月30日   

    情绪识别数据集Sad-Happy-AngryEmotionRecognitionDataset-michaeloster 数据来源:互联网公开数据 标签:情绪识别,数据集,情感分析,人工智能,机器学习,心理学,计算机视觉,自然语言处理 数据概述:...
    packageimg
  • 芬兰文本语料库2010-2020数据集-haaldrin

    2025年5月30日   

    芬兰文本语料库2010-2020数据集-haaldrin 数据来源:互联网公开数据 标签:文本语料库,自然语言处理,数据集,芬兰语,学术研究,语言学,机器学习,信息检索 数据概述:该数据集包含来自芬兰的文本数据,记录了2010年至2020年期间的多种类型的芬兰语文本。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。...
    packageimg
  • 僧伽罗语文本纠错数据集SinhalaTextCorrectionDataset-uom200199t

    2025年5月30日   

    僧伽罗语文本纠错数据集SinhalaTextCorrectionDataset-uom200199t 数据来源:互联网公开数据 标签:文本纠错, 僧伽罗语, 自然语言处理, 语言模型, 深度学习, 数据集, 文本校对, 机器学习 数据概述:...
    packageimg
  • K-Means聚类推文数据集-ved1104

    2025年5月30日   

    K-Means聚类推文数据集-ved1104 数据来源:互联网公开数据 标签:推文数据,文本聚类,机器学习,自然语言处理,社交媒体,数据挖掘,情感分析,主题建模 数据概述: 该数据集包含了从Twitter上收集的推文数据,这些数据经过了K-Means聚类分析。主要特征如下: 时间跨度:数据记录的时间范围不详,取决于原始推文的收集时间。...
    packageimg
  • CLIP-CYOYO75k数据集-anantjain1223

    2025年5月30日   

    CLIP-CYOYO75k数据集-anantjain1223 数据来源:互联网公开数据 标签:图像文本对,数据集,多模态,对比学习,CLIP,计算机视觉,自然语言处理,图像检索 数据概述: 该数据集包含75,000个图像-文本对,旨在用于多模态研究,特别是图像和文本的联合表示学习。主要特征如下:...
    packageimg
  • 反馈奖励计划情感分析数据集FeedbackPrize2PLData-shinomoriaoshi

    2025年5月30日   

    反馈奖励计划情感分析数据集FeedbackPrize2PLData-shinomoriaoshi 数据来源:互联网公开数据 标签:情感分析,自然语言处理,数据集,文本挖掘,机器学习,情感识别,文本分类,教育技术 数据概述: 该数据集来自反馈奖励计划项目,专注于情感分析任务,记录了大量的文本数据及其对应的情感标签。主要特征如下:...
    packageimg
  • 联合国新闻文章数据集UNNewsArticlesDataset-arditobryan

    2025年5月30日   

    联合国新闻文章数据集UNNewsArticlesDataset-arditobryan 数据来源:互联网公开数据 标签:新闻,联合国,国际关系,政治,数据集,文本分析,自然语言处理,时事 数据概述: 该数据集包含了来自联合国新闻网站的文章数据,记录了联合国及其相关机构发布的各种新闻报道和文章。主要特征如下:...
    packageimg
  • 有毒语言检测数据集ToxicLanguageDetectionDataset-mateuszalicante

    2025年5月30日   

    有毒语言检测数据集ToxicLanguageDetectionDataset-mateuszalicante 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据分析,机器学习,情感分析,数据挖掘,网络安全,在线社区 数据概述:...
    packageimg
  • Gemma模型重写数据集RewrittenGemma-7bDataset-patrickjchen

    2025年5月30日   

    Gemma模型重写数据集RewrittenGemma-7bDataset-patrickjchen 数据来源:互联网公开数据 标签:自然语言处理,机器学习,深度学习,文本生成,语言模型,模型重写,人工智能,大语言模型 数据概述: 该数据集包含对Gemma-7b语言模型的输出进行重写的数据,记录了原始文本和经过模型重写后的文本。主要特征如下:...
    packageimg
  • 中国古典文学数据集ChineseClassicalLiteratureDataset-exidjg

    2025年5月30日   

    中国古典文学数据集ChineseClassicalLiteratureDataset-exidjg 数据来源:互联网公开数据 标签:古典文学,数据集,文本分析,文化研究,机器学习,自然语言处理,历史文献,文学研究 数据概述: 该数据集包含来自中国古典文学领域的数据,记录了经典文学作品的相关信息。主要特征如下: 时间跨度:数据记录的时间范围从先秦至清代。...
    packageimg
  • 印度法院判决摘要对数据集-rishipjain

    2025年5月30日   

    印度法院判决摘要对数据集-rishipjain 数据来源:互联网公开数据 标签:法律,司法,数据集,文本摘要,自然语言处理,机器学习,印度,判决 数据概述: 该数据集包含来自印度法院的判决摘要对数据,记录了印度法院的判决原文及其对应的摘要。主要特征如下: 时间跨度:数据记录的时间范围未知,但涵盖了印度法院的各类判决。...
    packageimg
  • 智能客服电话文本交互数据集AgentCallTextDataset-lamperougy

    2025年5月30日   

    智能客服电话文本交互数据集AgentCallTextDataset-lamperougy 数据来源:互联网公开数据 标签:智能客服,电话交互,文本数据,自然语言处理,机器学习,语音识别,客户服务,数据分析 数据概述: 该数据集包含来自智能客服系统的电话交互文本记录,记录了客服与客户之间的对话内容。主要特征如下:...
    packageimg