找到11,684个数据集

标签: 自然语言处理

过滤结果
  • 雅虎问答主题分类数据集-2011至2021年

    2025年5月31日   

    雅虎问答主题分类数据集-2011至2021年 数据来源:互联网公开数据 标签:雅虎问答,主题分类,自然语言处理,信息检索,推荐系统,机器学习,文本分析 数据概述: 本数据集包含从雅虎问答平台收集的有关多个主题的问题及其最佳答案。数据集包括以下几个字段: - topic:问题所属的主题或类别。 - question_title:问题的标题或简短描述。 -...
    packageimg
  • 商品分类竞赛数据集

    2025年5月31日   

    商品分类竞赛数据集 数据来源:互联网公开数据 标签:商品分类,层次分类,不完全标注,数据融合,自然语言处理,机器学习,分类算法,商品属性,多平台数据,类别预测 数据概述: 本数据集源于DataFusion...
    packageimg
  • DBpedia语义分类数据集-14类-2014年-thedevastator

    2025年5月31日   

    DBpedia语义分类数据集-14类-2014年-thedevastator 数据来源:互联网公开数据 标签:DBpedia,语义分类,文本数据集,自然语言处理,机器学习,数据科学,知识图谱,文本分类,分类模型,研究数据集 数据概述:...
    packageimg
  • 毒性评论分类数据集

    2025年5月31日   

    毒性评论分类数据集 数据来源:互联网公开数据 标签:毒性评论,分类模型,自然语言处理,多语言,情感分析,文本处理,数据预处理 数据概述:...
    packageimg
  • 有毒评论清理数据集

    2025年5月31日   

    有毒评论清理数据集 数据来源:互联网公开数据 标签:毒性评论,自然语言处理,文本分类,数据清洗,机器学习,评论分析 数据概述:...
    packageimg
  • 挪威议会演讲数据集1963-2021

    2025年4月14日   

    挪威议会演讲数据集1963-2021 数据来源:互联网公开数据 标签:挪威议会,演讲,政治党派,时间序列,文本分析,自然语言处理 数据概述:...
    packageimg
  • 维基百科标题多语言翻译数据集

    2025年5月31日   

    维基百科标题多语言翻译数据集 数据来源:互联网公开数据 标签:维基百科,平行术语库,多语言翻译,印度语言,数据共享,自然语言处理 数据概述:...
    packageimg
  • 多语言视觉问答数据集

    2025年5月31日   

    多语言视觉问答数据集 数据来源:互联网公开数据 标签:多语言,视觉问答,英语,越南语,日语,图像分析,自然语言处理,跨语言学习 数据概述: 本数据集是首个包含英语、越南语和日语三种语言的多语言视觉问答数据集,包含33,000多个由人工创建的问题-...
    packageimg
  • 亚马逊商品评论情感细粒度分析数据集-训练与测试集

    2025年5月31日   

    亚马逊商品评论情感细粒度分析数据集-训练与测试集 数据来源:互联网公开数据 标签:亚马逊,商品评论,情感分析,文本数据,机器学习,自然语言处理,训练集,测试集 数据概述:...
    packageimg
  • 印度Reddit论坛所有帖子数据集2023

    2025年5月31日   

    印度Reddit论坛所有帖子数据集2023 数据来源:互联网公开数据 标签:Reddit,印度论坛,帖子数据,机器学习,文本分析,自然语言处理,数据分析 数据概述: 本数据集包含了印度 Reddit 论坛(r/india)上的所有帖子数据,旨在为构建帖子标签预测模型提供充足的数据支持。数据通过 Pushshift API...
    packageimg
  • Reddit社区帖子主题分类数据集-用户帖子内容-多社区-无时间

    2025年5月31日   

    Reddit社区帖子主题分类数据集-用户帖子内容-多社区-无时间 数据来源:互联网公开数据 标签:Reddit,社区,帖子,主题分类,文本分类,自然语言处理,机器学习,社交媒体,推荐系统 数据概述:...
    packageimg
  • 亚马逊2018年评论数据集

    2025年5月31日   

    亚马逊2018年评论数据集 数据来源:互联网公开数据 标签:亚马逊,评论,评分,自然语言处理,NLP,推荐系统,用户行为,商品分析 数据概述:...
    packageimg
  • 博客文本-数字内容管理数据集

    2025年5月31日   

    博客文本-数字内容管理数据集 数据来源:互联网公开数据 标签:数字内容管理,博客,作者特征,文本分类,多标签分类,自然语言处理 数据概述:...
    packageimg
  • 推特趋势话题与用户数据集

    2025年5月31日   

    推特趋势话题与用户数据集 数据来源:互联网公开数据 标签:推特,趋势话题,用户行为,社交网络分析,自然语言处理,聚类分析,推荐系统,机器人检测 数据概述:...
    packageimg
  • IMDB电影评论情感分析数据集-2021-mirnasherif

    2025年5月31日   

    IMDB电影评论情感分析数据集-2021-mirnasherif 数据来源:互联网公开数据 标签:IMDB,电影评论,情感分析,NLP,文本分析,机器学习,深度学习,自然语言处理 数据概述: 本数据集来源于IMDB,包含332,220条电影评论,以及对应的电影标题和IMDB的唯一标识符(tconst),旨在支持情感分析任务。数据集包含以下字段:...
    packageimg
  • 印度语短文本摘要语料库数据集

    2025年5月31日   

    印度语短文本摘要语料库数据集 数据来源:互联网公开数据 标签:印度语,文本摘要,新闻文章,自然语言处理,机器学习,语料库 数据概述: 本数据集包含约330,000篇来自印度新闻网站的文章及其标题,是首个用于基准测试的印度语文本摘要数据集。数据集保留了原文中的标点符号、数字等信息,为研究和开发印度语文本摘要技术提供了丰富的数据基础。 数据用途概述:...
    packageimg
  • 科学论文与新闻稿匹配数据集-chenxinye

    2025年5月31日   

    科学论文与新闻稿匹配数据集-chenxinye 数据来源:互联网公开数据 标签:科学,论文,新闻,匹配,自然语言处理,文本分析,科研,媒体,标题,摘要 数据概述:...
    packageimg
  • 孟加拉国日报BD-Pratidin新闻数据集-2017年12月13日至2020年9月9日-shakirulhasan

    2025年5月31日   

    孟加拉国日报BD-Pratidin新闻数据集-2017年12月13日至2020年9月9日-shakirulhasan 数据来源:互联网公开数据 标签:孟加拉语,新闻,文本,自然语言处理,NLP,文本分析,孟加拉国,BD-Pratidin,语料库 数据概述: 本数据集包含了从2017年12月13日至2020年9月9日期间,孟加拉国日报(BD-...
    packageimg
  • 美国东北地区法院意见情感分析数据集

    2025年5月31日   

    美国东北地区法院意见情感分析数据集 数据来源:互联网公开数据 标签:法院意见,情感分析,法律研究,美国东北地区,历史案例,文本挖掘,自然语言处理,司法数据,法律科技 数据概述:...
    packageimg
  • 问答知识库构建与内容检索数据集QuestionAnsweringKnowledgeBaseConstructionandContentRetrievalD...

    2025年5月31日   

    问答知识库构建与内容检索数据集QuestionAnsweringKnowledgeBaseConstructionandContentRetrievalDataset-ouaillaamiri02 数据来源:互联网公开数据 标签:问答系统, 知识库构建, 内容检索, 自然语言处理, 文本分析, 信息抽取, 机器学习, 语料库 数据概述:...
    packageimg