找到11,765个数据集

标签: 自然语言处理 None: 数据

过滤结果
  • 足球比赛结果预测数据集

    2025年7月24日 30 57 17

    足球比赛结果预测数据集_Soccer_Match_Result_Prediction_Dataset 数据来源:互联网公开数据 标签:足球比赛, 结果预测, 文本分类, 自然语言处理, 情感分析, 数据标注, 机器学习, 赛事分析 数据概述: 该数据集包含来自足球比赛相关的数据,记录了比赛结果预测所需的结构化文本和JSON格式信息。主要特征如下:...
    packageimg
  • 蛋白质摘要训练数据集

    2025年6月4日 30 5 0

    蛋白质摘要训练数据集 数据来源:互联网公开数据 标签:蛋白质研究,生物信息学,文本摘要,训练数据,生命科学,机器学习,自然语言处理 数据概述:...
    packageimg
  • 有毒评论清理数据集

    2025年5月31日 30 23 5

    有毒评论清理数据集 数据来源:互联网公开数据 标签:毒性评论,自然语言处理,文本分类,数据清洗,机器学习,评论分析 数据概述:...
    packageimg
  • 毒评论数据集

    2025年5月8日 30 75 35

    毒评论数据集 数据来源:互联网公开数据 标签:毒评论,自然语言处理,评论分类,情感分析,数据竞赛,文本强度评估 数据概述:...
    packageimg
  • 阅读理解竞赛数据集

    2025年4月27日 30 18 2

    阅读理解竞赛数据集 数据来源:互联网公开数据 标签:阅读理解,竞赛,教育,自然语言处理,文本分析,机器学习,英语学习 数据概述:...
    packageimg
  • 过滤推文数据集

    2025年4月26日 30 198 39

    过滤推文数据集 数据来源:互联网公开数据 标签:推文,社交媒体,文本分析,自然语言处理,情绪分析,用户行为,MBTI人格类型,文本分类 数据概述:...
    packageimg
  • 清洁有毒评论数据集

    2025年4月24日 30 191 163

    清洁有毒评论数据集 数据来源:互联网公开数据 标签:有毒评论,自然语言处理,文本分类,情感分析,数据预处理 数据概述:...
    packageimg
  • 波斯语文章标注数据集

    2025年4月22日 30 187 161

    波斯语文章标注数据集 数据来源:互联网公开数据 标签:波斯语,文章标注,自然语言处理,标签预测,写作辅助,内容分类,谷歌趋势 数据概述:...
    packageimg
  • 自然问答数据集

    2025年4月18日 30 182 71

    自然问答数据集 数据来源:互联网公开数据 标签:自然问答,问答系统,自然语言处理,机器学习,数据预处理,问答生成,信息检索 数据概述: 本数据集由Google AI...
    packageimg
  • 秘鲁美食评论数据集

    2025年4月18日 30 184 148

    秘鲁美食评论数据集 数据来源:互联网公开数据 标签:秘鲁美食,餐厅评论,情感分析,文本分类,用户评价,地理分布,餐厅运营,消费者行为,自然语言处理 数据概述:...
    packageimg
  • 自然语言推理数据集

    2025年4月17日 30 94 4

    自然语言推理数据集 数据来源:互联网公开数据 标签:自然语言推理,句子理解,文本相似度,文本蕴含,语义分析,机器学习,自然语言处理 数据概述:...
    packageimg
  • 种族歧视检测数据集

    2025年4月15日 30 14 3

    种族歧视检测数据集 数据来源:互联网公开数据 标签:种族歧视,评论分析,自然语言处理,情感分析,偏见检测,机器学习,数据清洗 数据概述:...
    packageimg
  • 新闻文章摘要数据集

    2025年4月15日 30 40 17

    新闻文章摘要数据集 数据来源:互联网公开数据 标签:新闻,文章,摘要,标题,超链接,内容,文本分析,自然语言处理 数据概述: 本数据集包含了新闻文章的标题、超链接和正文内容。数据集覆盖了广泛的新闻来源,提供了丰富的文本信息,适用于新闻分析、文本摘要生成和自然语言处理等多种应用场景。 数据用途概述:...
    packageimg
  • 疾病文章数据集

    2025年4月15日 30 182 93

    疾病文章数据集 数据来源:互联网公开数据 标签:疾病,文章,文本处理,自然语言处理,Spacy,BERT,机器学习 数据概述:...
    packageimg
  • 汽车评论数据集

    2025年4月15日 30 131 122

    汽车评论数据集 数据来源:互联网公开数据 标签:汽车评论,用户评价,自然语言处理,情感分析,产品反馈,消费者行为 数据概述: 本数据集包含用户对各种汽车的评论,记录了不同消费者对汽车性能、外观、油耗等方面的具体评价。数据集旨在提供有关汽车产品反馈的全面信息,可用于分析消费者对汽车产品的偏好和不满。 数据用途概述:...
    packageimg
  • 随机日期数据集

    2025年4月14日 30 112 24

    随机日期数据集 数据来源:互联网公开数据 标签:日期识别,机器学习,自然语言处理,数据标注,文本分析,日期标注,日期提取 数据概述: 本数据集包含由Python脚本生成的随机日期数据,旨在用于机器学习模型训练,以识别文档中的日期。数据集标注了每个词或词组是否为日期,为日期标注任务提供了基础。 数据用途概述:...
    packageimg
  • 疾病百科数据集

    2025年4月14日 30 93 45

    疾病百科数据集 数据来源:互联网公开数据 标签:疾病,医学,诊断,治疗,西班牙语,自然语言处理,机器学习,训练数据,健康信息 数据概述: 本数据集包含了来自西班牙语维基百科(Wikipedia...
    packageimg
  • 洛杉矶推特新闻数据集

    2025年4月14日 30 23 7

    洛杉矶推特新闻数据集 数据来源:互联网公开数据 标签:洛杉矶,推特,新闻,分类,自然语言处理,NLP,文本分析 数据概述:...
    packageimg
  • 汽车规格数据集

    2025年4月14日 30 139 35

    汽车规格数据集 数据来源:互联网公开数据 标签:汽车规格,车辆信息,汽车品牌,发动机,变速箱,油耗,尺寸,数据清洗,自然语言处理,分类 数据概述:...
    packageimg
  • 洋葱新闻数据集

    2025年4月14日 30 153 66

    洋葱新闻数据集 数据来源:互联网公开数据 标签:洋葱新闻,真实新闻,文本分类,机器学习,自然语言处理,数据集,新闻真实性 数据概述: 本数据集包含《The Onion》发布的假新闻文章和来自Reddit论坛r/NotTheOnion的真实“洋葱式”新闻文章。《The...
    packageimg