找到11,736个数据集

标签: 自然语言处理

过滤结果
  • 大型语言模型生成的维基百科多选题数据集-yalickj

    2025年4月23日   

    大型语言模型生成的维基百科多选题数据集-yalickj 数据来源:互联网公开数据 标签:多选题,维基百科,人工智能,机器学习,自然语言处理,考试,教育,测评,生成式AI 数据概述: 本数据集包含由大型语言模型(LLMs, Large Language...
    packageimg
  • BBC新闻导航数据集BBCNewsNavigatorDataset-remyakarthika

    2025年4月23日   

    BBC新闻导航数据集BBCNewsNavigatorDataset-remyakarthika 数据来源:互联网公开数据 标签:新闻媒体,数据集,文本分析,自然语言处理,信息检索,机器学习,新闻分类,数据分析 数据概述:该数据集包含来自BBC新闻导航系统的数据,记录了新闻文章的详细信息。主要特征如下:...
    packageimg
  • 沃森翻译文本对比数据集ContradictoryMyWatsonTranslatedDataset-pradeepmuniasamy

    2025年4月23日   

    沃森翻译文本对比数据集ContradictoryMyWatsonTranslatedDataset-pradeepmuniasamy 数据来源:互联网公开数据 标签:机器翻译,文本对比,数据集,自然语言处理,深度学习,文本分析,翻译质量,语言学 数据概述: 该数据集包含由IBM...
    packageimg
  • 性别预测姓名数据集GenderPredictionbyNameDataset-franjmartin21

    2025年4月23日   

    性别预测姓名数据集GenderPredictionbyNameDataset-franjmartin21 数据来源:互联网公开数据 标签:姓名,性别预测,数据集,人口统计,机器学习,自然语言处理,数据清洗,分类分析 数据概述:该数据集包含来自多个来源的姓名和对应的性别信息,主要用于性别预测分析。主要特征如下:...
    packageimg
  • 垃圾邮件识别数据集SpamEmailDataDataset-ukveteran

    2025年4月23日   

    垃圾邮件识别数据集SpamEmailDataDataset-ukveteran 数据来源:互联网公开数据 标签:邮件分类,垃圾邮件,数据集,机器学习,自然语言处理,文本分析,网络安全,数据挖掘 数据概述: 该数据集包含来自互联网公开来源的电子邮件数据,记录了邮件的文本内容和标签(是否为垃圾邮件)。主要特征如下:...
    packageimg
  • OOS数据集OutOfScopeDataset-fameholy

    2025年4月23日   

    OOS数据集OutOfScopeDataset-fameholy 数据来源:互联网公开数据 标签:对话系统,数据集,自然语言处理,意图识别,机器学习,人工智能,对话分析,聊天机器人 数据概述:该数据集包含来自多个对话系统的对话记录,用于训练和测试对话系统的意图识别能力,特别关注对话中超出预设范围(Out of Scope)的用户输入。主要特征如下:...
    packageimg
  • Mercari平台商品交易数据集MercariDataset-rohitamalnerkar

    2025年4月23日   

    Mercari平台商品交易数据集MercariDataset-rohitamalnerkar 数据来源:互联网公开数据 标签:电子商务,商品交易,数据集,机器学习,数据分析,自然语言处理,推荐系统,商业智能 数据概述:该数据集包含来自Mercari平台的商品交易数据,记录了平台上商品的详细信息和交易情况。主要特征如下:...
    packageimg
  • 机器学习与数据科学领域文章摘要及链接数据集-Medium-AnalyticsVidhya-TowardsDataScience-pratirup

    2025年4月23日   

    机器学习与数据科学领域文章摘要及链接数据集-Medium-AnalyticsVidhya-TowardsDataScience-pratirup 数据来源:互联网公开数据 标签:机器学习,数据科学,文章,博客,Medium,Analytics Vidhya,Towards Data Science,自然语言处理,深度学习,人工智能,数据挖掘,文本分析...
    packageimg
  • 仇恨言论分类数据集HateClassificationDataset-tushar877

    2025年4月23日   

    仇恨言论分类数据集HateClassificationDataset-tushar877 数据来源:互联网公开数据 标签:文本分析,仇恨言论,数据集,情感分析,机器学习,自然语言处理,社会研究,网络安全 数据概述: 该数据集包含来自社交媒体平台和网络论坛的文本数据,记录了各类言论及其是否属于仇恨言论的标签。主要特征如下:...
    packageimg
  • 情绪检测社交媒体数据集ToneDetectionSocialMediaDataset-zeeshanshaik75

    2025年4月23日   

    情绪检测社交媒体数据集ToneDetectionSocialMediaDataset-zeeshanshaik75 数据来源:互联网公开数据 标签:情绪分析,数据集,社交媒体,自然语言处理,机器学习,文本分析,情绪识别,情感计算 数据概述: 该数据集包含来自社交媒体平台的数据,记录了用户发布的内容及其对应的情绪标签。主要特征如下:...
    packageimg
  • 自然语言处理情感分析数据集NaturalLanguageProcessingSentimentAnalysisDataset-alihamadbakar

    2025年4月23日   

    自然语言处理情感分析数据集NaturalLanguageProcessingSentimentAnalysisDataset-alihamadbakar 数据来源:互联网公开数据 标签:自然语言处理,情感分析,数据集,文本挖掘,机器学习,文本分类,人工智能,语言技术...
    packageimg
  • 阿拉伯语文本可读性与长文本摘要数据集-elhadjemechache

    2025年4月23日   

    阿拉伯语文本可读性与长文本摘要数据集-elhadjemechache 数据来源:互联网公开数据 标签:阿拉伯语,文本可读性,文本摘要,自然语言处理,语言学,数据集,机器翻译,深度学习 数据概述: 该数据集包含阿拉伯语文本,用于研究阿拉伯语文本的可读性和文本摘要。主要特征如下: 时间跨度: 数据记录的时间范围不明确,数据本身为静态文本集合。 地理范围:...
    packageimg
  • 在线欺凌文本数据集-agadaunogwu

    2025年4月23日   

    在线欺凌文本数据集-agadaunogwu 数据来源:互联网公开数据 标签:网络欺凌,文本数据,自然语言处理,情感分析,机器学习,社交媒体,文本分类,恶意言论 数据概述: 该数据集包含来自社交媒体平台的文本数据,记录了用户之间的在线欺凌行为。主要特征如下: 时间跨度:数据记录的时间范围为未知,但包含了近期社交媒体上的文本信息。...
    packageimg
  • 评论测试检查翻译数据集1CommentsTestCheckTranslateDataset1-yamak1906

    2025年4月23日   

    评论测试检查翻译数据集1CommentsTestCheckTranslateDataset1-yamak1906 数据来源:互联网公开数据 标签:评论数据,数据集,翻译测试,自然语言处理,文本分析,机器学习,多语言支持,质量检查...
    packageimg
  • GPT-3模型性能评估数据集GPT-3ModelPerformanceEvaluationDataset-utsavshek

    2025年4月23日   

    GPT-3模型性能评估数据集GPT-3ModelPerformanceEvaluationDataset-utsavshek 数据来源:互联网公开数据 标签:自然语言处理,人工智能,数据集,机器学习,模型评估,语言模型,深度学习,算法研究 数据概述:...
    packageimg
  • Mistral生成数据集Mistral-GeneratedDataDataset-hajarhisham

    2025年4月23日   

    Mistral生成数据集Mistral-GeneratedDataDataset-hajarhisham 数据来源:互联网公开数据 标签:人工智能,自然语言处理,数据集,机器学习,文本生成,语言模型,深度学习,数据增强 数据概述: 该数据集由Mistral模型生成,包含大量文本数据,适用于自然语言处理和机器学习任务。主要特征如下:...
    packageimg
  • 概念嵌入数据集ConceptsEmbeddingDataset-wakeuptoreality

    2025年4月23日   

    概念嵌入数据集ConceptsEmbeddingDataset-wakeuptoreality 数据来源:互联网公开数据 标签:概念嵌入,自然语言处理,数据集,语义理解,词向量,知识表示,机器学习,文本分析 数据概述: 该数据集包含了各种概念的嵌入表示,旨在捕捉词汇和概念之间的语义关系。主要特征如下: 时间跨度:...
    packageimg
  • 阿拉伯语文本摘要基准数据集ArabicSummarizationBenchmarkDataset-bavlygeorge

    2025年4月23日   

    阿拉伯语文本摘要基准数据集ArabicSummarizationBenchmarkDataset-bavlygeorge 数据来源:互联网公开数据 标签:阿拉伯语,文本摘要,数据集,自然语言处理,机器学习,语言学,信息检索,翻译 数据概述: 该数据集包含来自多个来源的阿拉伯语文本数据,旨在用于文本摘要任务的评估和研究。主要特征如下:...
    packageimg
  • 电影评论预处理数据集IMDB电影评论数据集-mantri7

    2025年4月23日   

    电影评论预处理数据集IMDB电影评论数据集-mantri7 数据来源:互联网公开数据 标签:电影评论,数据集,自然语言处理,情感分析,机器学习,文本挖掘,电影行业,评论分析 数据概述:该数据集包含来自IMDB的电影评论数据,经过预处理,适用于情感分析和文本分类任务。主要特征如下: 时间跨度:数据记录的时间范围从2000年到2017年。...
    packageimg
  • 斯坦福大型电影评论数据集StanfordLargeMovieReviewDataset-abirchodha

    2025年4月23日   

    斯坦福大型电影评论数据集StanfordLargeMovieReviewDataset-abirchodha 数据来源:互联网公开数据 标签:电影评论,情感分析,文本分类,自然语言处理,机器学习,数据集,情感识别,NLP 数据概述: 该数据集由斯坦福大学提供,包含了来自IMDb的电影评论数据,主要用于情感分析研究。主要特征如下:...
    packageimg