找到11,551个数据集

标签: 自然语言处理

过滤结果
  • 对话数据集

    2025年5月31日 30 6 2

    对话数据集 数据来源:互联网公开数据 标签:对话数据集,自然语言处理,聊天机器人,会话分析,机器学习,人工智能,数据训练 数据概述: 本数据集是一个经过标注的对话集合,包含来自openerotica和freedom-...
    packageimg
  • WELFake虚假新闻文本分类数据集-studymart

    2025年5月31日 30 95 0

    WELFake虚假新闻文本分类数据集-studymart 数据来源:互联网公开数据 标签:虚假新闻,文本分类,自然语言处理,机器学习,新闻,真实性,WELFake,文本分析 数据概述:...
    packageimg
  • 网络评论中仇恨言论检测数据集-2023年-cabmarcos

    2025年5月31日 30 20 16

    网络评论中仇恨言论检测数据集-2023年-cabmarcos 数据来源:互联网公开数据 标签:仇恨言论,社交媒体,文本分析,自然语言处理,数据清理,文本数据,社交网络,情感分析,数据预处理 数据概述:...
    packageimg
  • MDPI平台气候变化相关论文元数据数据集-devrajkashyap

    2025年5月31日 30 28 3

    MDPI平台气候变化相关论文元数据数据集-devrajkashyap 数据来源:互联网公开数据 标签:气候变化,论文,元数据,MDPI,学术研究,自然语言处理,文本分析 数据概述: 本数据集包含了从MDPI(Multidisciplinary Digital Publishing...
    packageimg
  • 伊博语重音符号恢复数据集

    2025年5月31日 30 3 2

    伊博语重音符号恢复数据集 数据来源:互联网公开数据 标签:伊博语,重音符号恢复,自然语言处理,机器学习,文本处理,语言资源 数据概述: 本数据集包含超过50万条经过精心整理的伊博语文本数据,数据来源包括开放获取的伊博语文学文本,如书籍、新闻文章等。数据集经过转录和预处理,旨在为AI模型的训练提供高质量的文本资源,特别是在模式识别领域。 数据用途概述:...
    packageimg
  • 雅虎问答主题分类数据集-2011至2021年

    2025年5月31日 30 181 34

    雅虎问答主题分类数据集-2011至2021年 数据来源:互联网公开数据 标签:雅虎问答,主题分类,自然语言处理,信息检索,推荐系统,机器学习,文本分析 数据概述: 本数据集包含从雅虎问答平台收集的有关多个主题的问题及其最佳答案。数据集包括以下几个字段: - topic:问题所属的主题或类别。 - question_title:问题的标题或简短描述。 -...
    packageimg
  • 商品分类竞赛数据集

    2025年5月31日 30 69 16

    商品分类竞赛数据集 数据来源:互联网公开数据 标签:商品分类,层次分类,不完全标注,数据融合,自然语言处理,机器学习,分类算法,商品属性,多平台数据,类别预测 数据概述: 本数据集源于DataFusion...
    packageimg
  • DBpedia语义分类数据集-14类-2014年-thedevastator

    2025年5月31日 30 43 31

    DBpedia语义分类数据集-14类-2014年-thedevastator 数据来源:互联网公开数据 标签:DBpedia,语义分类,文本数据集,自然语言处理,机器学习,数据科学,知识图谱,文本分类,分类模型,研究数据集 数据概述:...
    packageimg
  • 毒性评论分类数据集

    2025年5月31日 30 60 20

    毒性评论分类数据集 数据来源:互联网公开数据 标签:毒性评论,分类模型,自然语言处理,多语言,情感分析,文本处理,数据预处理 数据概述:...
    packageimg
  • 有毒评论清理数据集

    2025年5月31日 30 181 128

    有毒评论清理数据集 数据来源:互联网公开数据 标签:毒性评论,自然语言处理,文本分类,数据清洗,机器学习,评论分析 数据概述:...
    packageimg
  • 挪威议会演讲数据集1963-2021

    2025年4月14日 60 158 15

    挪威议会演讲数据集1963-2021 数据来源:互联网公开数据 标签:挪威议会,演讲,政治党派,时间序列,文本分析,自然语言处理 数据概述:...
    packageimg
  • 维基百科标题多语言翻译数据集

    2025年5月31日 30 152 63

    维基百科标题多语言翻译数据集 数据来源:互联网公开数据 标签:维基百科,平行术语库,多语言翻译,印度语言,数据共享,自然语言处理 数据概述:...
    packageimg
  • 多语言视觉问答数据集

    2025年5月31日 30 109 107

    多语言视觉问答数据集 数据来源:互联网公开数据 标签:多语言,视觉问答,英语,越南语,日语,图像分析,自然语言处理,跨语言学习 数据概述: 本数据集是首个包含英语、越南语和日语三种语言的多语言视觉问答数据集,包含33,000多个由人工创建的问题-...
    packageimg
  • 亚马逊商品评论情感细粒度分析数据集-训练与测试集

    2025年5月31日 30 65 2

    亚马逊商品评论情感细粒度分析数据集-训练与测试集 数据来源:互联网公开数据 标签:亚马逊,商品评论,情感分析,文本数据,机器学习,自然语言处理,训练集,测试集 数据概述:...
    packageimg
  • 印度Reddit论坛所有帖子数据集2023

    2025年5月31日 30 67 20

    印度Reddit论坛所有帖子数据集2023 数据来源:互联网公开数据 标签:Reddit,印度论坛,帖子数据,机器学习,文本分析,自然语言处理,数据分析 数据概述: 本数据集包含了印度 Reddit 论坛(r/india)上的所有帖子数据,旨在为构建帖子标签预测模型提供充足的数据支持。数据通过 Pushshift API...
    packageimg
  • Reddit社区帖子主题分类数据集-用户帖子内容-多社区-无时间

    2025年5月31日 30 52 8

    Reddit社区帖子主题分类数据集-用户帖子内容-多社区-无时间 数据来源:互联网公开数据 标签:Reddit,社区,帖子,主题分类,文本分类,自然语言处理,机器学习,社交媒体,推荐系统 数据概述:...
    packageimg
  • 亚马逊2018年评论数据集

    2025年5月31日 30 109 37

    亚马逊2018年评论数据集 数据来源:互联网公开数据 标签:亚马逊,评论,评分,自然语言处理,NLP,推荐系统,用户行为,商品分析 数据概述:...
    packageimg
  • 博客文本-数字内容管理数据集

    2025年5月31日 30 49 33

    博客文本-数字内容管理数据集 数据来源:互联网公开数据 标签:数字内容管理,博客,作者特征,文本分类,多标签分类,自然语言处理 数据概述:...
    packageimg
  • 推特趋势话题与用户数据集

    2025年5月31日 30 43 39

    推特趋势话题与用户数据集 数据来源:互联网公开数据 标签:推特,趋势话题,用户行为,社交网络分析,自然语言处理,聚类分析,推荐系统,机器人检测 数据概述:...
    packageimg
  • IMDB电影评论情感分析数据集-2021-mirnasherif

    2025年5月31日 30 13 8

    IMDB电影评论情感分析数据集-2021-mirnasherif 数据来源:互联网公开数据 标签:IMDB,电影评论,情感分析,NLP,文本分析,机器学习,深度学习,自然语言处理 数据概述: 本数据集来源于IMDB,包含332,220条电影评论,以及对应的电影标题和IMDB的唯一标识符(tconst),旨在支持情感分析任务。数据集包含以下字段:...
    packageimg