找到11,684个数据集

标签: 自然语言处理

过滤结果
  • 亚马逊印度抓取数据集

    2025年4月14日   

    亚马逊印度抓取数据集 数据来源:互联网公开数据 标签:亚马逊印度,抓取数据,电子商务,产品信息,价格,评分,评论,图像分类,自然语言处理 数据概述:...
    packageimg
  • 生成式人工智能推文数据集2022-2023

    2025年4月14日   

    生成式人工智能推文数据集2022-2023 数据来源:互联网公开数据 标签:生成式人工智能,推特,趋势分析,意见挖掘,用户分析,自然语言处理 数据概述:...
    packageimg
  • 印度古吉拉特语新闻标题数据集1963-2021

    2025年4月14日   

    印度古吉拉特语新闻标题数据集1963-2021 数据来源:互联网公开数据 标签:古吉拉特语,新闻标题,文本分类,机器学习,自然语言处理,数据清洗 数据概述: 本数据集包含约6500篇从古吉拉特语新闻网站收集的新闻标题。数据集已经过清洗处理,并分为训练集和测试集,适用于对古吉拉特语文本分类模型的性能进行基准测试。 数据用途概述:...
    packageimg
  • 英国广播公司BBC新闻文章分类数据集

    2025年4月14日   

    英国广播公司BBC新闻文章分类数据集 数据来源:互联网公开数据 标签:新闻文章,BBC,文本分类,自然语言处理,新闻聚合,舆情分析,文本挖掘,新闻类别 数据概述:...
    packageimg
  • 印度板球评论分析数据集1963-2021

    2025年4月14日   

    印度板球评论分析数据集1963-2021 数据来源:互联网公开数据 标签:板球,评论分析,自然语言处理,文本分类,情感分析,机器学习 数据概述: 本数据集是一个强大的工具,用于理解和分析板球比赛中的评论。数据集包括三个部分:Validation.csv、Train.csv 和...
    packageimg
  • YouTube视频转录文本数据分析数据集

    2025年4月14日   

    YouTube视频转录文本数据分析数据集 数据来源:互联网公开数据 标签:YouTube,视频,转录文本,语音识别,文本分析,自然语言处理,内容创作,社交媒体 数据概述:...
    packageimg
  • 波斯语产品描述实体识别挑战数据集2023

    2025年4月14日   

    波斯语产品描述实体识别挑战数据集2023 数据来源:互联网公开数据 标签:实体识别,产品描述,自然语言处理,波斯语,市场数据 数据概述: 本数据集收录了由零售商提供的波斯语产品描述数据,旨在进行关键实体的提取。数据集包含产品标题和详细描述,要求从这些文本中识别出主要讨论的产品。 数据用途概述:...
    packageimg
  • 漫威电影宇宙01-钢铁侠对话数据集

    2025年4月14日   

    漫威电影宇宙01-钢铁侠对话数据集 数据来源:互联网公开数据 标签:漫威电影宇宙,钢铁侠,对话数据,问答系统,自然语言处理,教育,娱乐 数据概述: 本数据集包含了电影《钢铁侠》中的所有对话,经过处理转换为问答对格式,旨在帮助构建封闭领域问答系统。数据集涵盖了电影中的关键对话和情节,为研究和开发提供了丰富的语言素材。 数据用途概述:...
    packageimg
  • IMDB电影剧集情节摘要文本分类数据集

    2025年4月14日   

    IMDB电影剧集情节摘要文本分类数据集 数据来源:互联网公开数据 标签:IMDB, 电影, 文本分类, 机器学习, 自然语言处理, 类别识别 数据概述: 本数据集包含 1000 条来自 IMDB(Internet Movie Database)的电影/电视剧剧情概要,涵盖 4...
    packageimg
  • 土耳其客户评论数据集二分类情感分析

    2025年4月14日   

    土耳其客户评论数据集二分类情感分析 数据来源:互联网公开数据 标签:土耳其语,情感分析,二分类,自然语言处理,客户评论,文本数据,学术研究 数据概述:...
    packageimg
  • 沃森翻译增强训练测试数据集

    2025年4月14日   

    沃森翻译增强训练测试数据集 数据来源:互联网公开数据 标签:自然语言处理,数据增强,翻译,机器翻译,文本对,假设检验,训练集,测试集,数据扩增,Augmentation 数据概述:...
    packageimg
  • 印度短信垃圾信息检测数据集1963-2021

    2025年4月14日   

    印度短信垃圾信息检测数据集1963-2021 数据来源:互联网公开数据 标签:短信,垃圾信息检测,文本分类,机器学习,自然语言处理 数据概述:...
    packageimg
  • 正常-仇恨和侮辱性言论数据集

    2025年4月14日   

    正常-仇恨和侮辱性言论数据集 数据来源:互联网公开数据 标签:正常言论,仇恨言论,侮辱性言论,社交媒体分析,文本分析,自然语言处理,社交媒体监控 数据概述:...
    packageimg
  • 印度销售交易自然语言处理数据集1963-2021

    2025年4月14日   

    印度销售交易自然语言处理数据集1963-2021 数据来源:互联网公开数据 标签:销售数据,自然语言处理,文本提取,会计自动化,机器学习,训练数据,客户信息,产品信息,支付方式 数据概述:...
    packageimg
  • 电影评论数据集情感分析用

    2025年4月14日   

    电影评论数据集情感分析用 数据来源:互联网公开数据 标签:电影评论,情感分析,自然语言处理,二分类,正面评论,负面评论 数据概述: 本数据集来源于IMDb.com网站,由Bo Pang和Lillian...
    packageimg
  • 情绪分析-社交媒体文本数据集2015-2023

    2025年4月14日   

    情绪分析-社交媒体文本数据集2015-2023 数据来源:互联网公开数据 标签:情绪分析,情感识别,社交媒体,文本挖掘,JUUL,电子烟,自然语言处理 数据概述:...
    packageimg
  • 基于Transformer的图神经网络与BERT风格瓦片模型预训练数据集

    2025年4月14日   

    基于Transformer的图神经网络与BERT风格瓦片模型预训练数据集 数据来源:互联网公开数据 标签:Transformer,图神经网络,BERT,预训练模型,模型库,机器学习,自然语言处理,TF-GNN,瓦片模型,开发 数据概述: 本数据集包含了预训练的TF-...
    packageimg
  • 尼泊尔语情感分析数据集

    2025年4月14日   

    尼泊尔语情感分析数据集 数据来源:互联网公开数据 标签:尼泊尔语,情感分析,自然语言处理,文本分类,社交媒体分析,机器学习 数据概述:...
    packageimg
  • 常识问答多选题数据集-CommonsenseQA-通用版

    2025年4月14日   

    常识问答多选题数据集-CommonsenseQA-通用版 数据来源:互联网公开数据 标签:常识推理,问答系统,多选题,自然语言处理,机器学习,人工智能,知识图谱 数据概述: 本数据集CommonsenseQA是一个多项选择题问答数据集,旨在考察模型对常识知识的理解和推理能力。 数据集包含12,102个问题,每个问题有一个正确答案和四个干扰选项。...
    packageimg
  • WordNet词汇下位词关系数据集

    2025年4月14日   

    WordNet词汇下位词关系数据集 数据来源:互联网公开数据 标签:WordNet,词汇语义,下位词,语言学,词典,自然语言处理,知识图谱 数据概述: 本数据集包含了从WordNet...
    packageimg