找到16,243个数据集

标签: 自然语言处理

过滤结果
  • IMDB电影剧集情节摘要文本分类数据集

    2025年4月14日   

    IMDB电影剧集情节摘要文本分类数据集 数据来源:互联网公开数据 标签:IMDB, 电影, 文本分类, 机器学习, 自然语言处理, 类别识别 数据概述: 本数据集包含 1000 条来自 IMDB(Internet Movie Database)的电影/电视剧剧情概要,涵盖 4...
    packageimg
  • 路透社新闻专线主题数据集

    2025年4月14日   

    路透社新闻专线主题数据集 数据来源:互联网公开数据 标签:新闻分类,路透社,媒体分析,NLP,新闻趋势,政治,经济,体育,文化,技术 数据概述: 本数据集基于新闻主题分类数据集,旨在用于新闻分类任务,涵盖了新闻文章的各种特征,如文章长度、关键词频率、文章基调和其它分类指标。数据集中的每篇文章都被标记为五个主要新闻类别之一:政治、经济、体育、文化和技术。...
    packageimg
  • AI课程大纲数据集

    2025年4月14日   

    AI课程大纲数据集 数据来源:互联网公开数据 标签:人工智能,课程大纲,教育分析,教学方法,评估方法,课程主题 数据概述:...
    packageimg
  • 权力的游戏角色关联数据集

    2025年4月14日   

    权力的游戏角色关联数据集 数据来源:互联网公开数据 标签:权力的游戏,角色关联,数据挖掘,算法分析,网络关系,社交网络,文学分析 数据概述:...
    packageimg
  • 土耳其客户评论数据集二分类情感分析

    2025年4月14日   

    土耳其客户评论数据集二分类情感分析 数据来源:互联网公开数据 标签:土耳其语,情感分析,二分类,自然语言处理,客户评论,文本数据,学术研究 数据概述:...
    packageimg
  • 沃森翻译增强训练测试数据集

    2025年4月14日   

    沃森翻译增强训练测试数据集 数据来源:互联网公开数据 标签:自然语言处理,数据增强,翻译,机器翻译,文本对,假设检验,训练集,测试集,数据扩增,Augmentation 数据概述:...
    packageimg
  • 数据2019印度板球联赛IPL比赛评论数据集

    2025年4月14日   

    数据2019印度板球联赛IPL比赛评论数据集 数据来源:互联网公开数据 标签:板球比赛,印度板球联赛,IPL,实时评论,比赛分析,NLP,文本标注,体育数据 数据概述 本数据集包含2019年印度板球联赛(IPL)所有比赛的球级(ball-level)实时评论数据,以及比赛概要信息。数据来源于ESPN...
    packageimg
  • 印度短信垃圾信息检测数据集1963-2021

    2025年4月14日   

    印度短信垃圾信息检测数据集1963-2021 数据来源:互联网公开数据 标签:短信,垃圾信息检测,文本分类,机器学习,自然语言处理 数据概述:...
    packageimg
  • 正常-仇恨和侮辱性言论数据集

    2025年4月14日   

    正常-仇恨和侮辱性言论数据集 数据来源:互联网公开数据 标签:正常言论,仇恨言论,侮辱性言论,社交媒体分析,文本分析,自然语言处理,社交媒体监控 数据概述:...
    packageimg
  • 印度销售交易自然语言处理数据集1963-2021

    2025年4月14日   

    印度销售交易自然语言处理数据集1963-2021 数据来源:互联网公开数据 标签:销售数据,自然语言处理,文本提取,会计自动化,机器学习,训练数据,客户信息,产品信息,支付方式 数据概述:...
    packageimg
  • 托马斯杯2022羽毛球推文数据集

    2025年4月14日   

    托马斯杯2022羽毛球推文数据集 数据来源:互联网公开数据 标签:托马斯杯,羽毛球,社交媒体,文本分析,情感分析,话题分布,体育赛事,实时分析 数据概述:...
    packageimg
  • Reddit用户抑郁症讨论文本数据集

    2025年4月14日   

    Reddit用户抑郁症讨论文本数据集 数据来源:互联网公开数据 标签:Reddit,抑郁症,文本数据,情感分析,机器学习,心理健康,社交媒体,数据挖掘 数据概述: 本数据集来源于Reddit平台,由私人在一项使用机器学习技术检测抑郁症的广泛研究项目中整理。 数据通过数据挖掘的方式获取,并经过了简单的数据清洗,以提高数据质量。...
    packageimg
  • 电影评论数据集情感分析用

    2025年4月14日   

    电影评论数据集情感分析用 数据来源:互联网公开数据 标签:电影评论,情感分析,自然语言处理,二分类,正面评论,负面评论 数据概述: 本数据集来源于IMDb.com网站,由Bo Pang和Lillian...
    packageimg
  • 猴痘疫情社交媒体信息传播分析数据集-2022年7月-8月

    2025年4月14日   

    猴痘疫情社交媒体信息传播分析数据集-2022年7月-8月 数据来源:互联网公开数据 标签:猴痘,疫情,社交媒体,推特,信息,误导信息,分类,文本分析,公共卫生,健康 数据概述: 本数据集包含两组关于猴痘病毒的推文数据,旨在用于分析社交媒体上猴痘相关信息的传播情况,特别是误导性信息的识别。数据集中的推文均来自推特平台,并经过人工标注,标注方式包括两种:...
    packageimg
  • 特朗普事件推特数据集

    2025年4月14日   

    特朗普事件推特数据集 数据来源:互联网公开数据 标签:特朗普,推特,新闻事件,社会影响,公众反应,舆论分析,社交媒体趋势 数据概述:...
    packageimg
  • 情绪分析-社交媒体文本数据集2015-2023

    2025年4月14日   

    情绪分析-社交媒体文本数据集2015-2023 数据来源:互联网公开数据 标签:情绪分析,情感识别,社交媒体,文本挖掘,JUUL,电子烟,自然语言处理 数据概述:...
    packageimg
  • 基于Transformer的图神经网络与BERT风格瓦片模型预训练数据集

    2025年4月14日   

    基于Transformer的图神经网络与BERT风格瓦片模型预训练数据集 数据来源:互联网公开数据 标签:Transformer,图神经网络,BERT,预训练模型,模型库,机器学习,自然语言处理,TF-GNN,瓦片模型,开发 数据概述: 本数据集包含了预训练的TF-...
    packageimg
  • 尼泊尔语情感分析数据集

    2025年4月14日   

    尼泊尔语情感分析数据集 数据来源:互联网公开数据 标签:尼泊尔语,情感分析,自然语言处理,文本分类,社交媒体分析,机器学习 数据概述:...
    packageimg
  • 库尔德语假新闻数据集

    2025年4月14日   

    库尔德语假新闻数据集 数据来源:互联网公开数据 标签:假新闻检测,库尔德语,NLP,文本分类,新闻真实性,社交媒体内容,数据集 数据概述:...
    packageimg
  • 常识问答多选题数据集-CommonsenseQA-通用版

    2025年4月14日   

    常识问答多选题数据集-CommonsenseQA-通用版 数据来源:互联网公开数据 标签:常识推理,问答系统,多选题,自然语言处理,机器学习,人工智能,知识图谱 数据概述: 本数据集CommonsenseQA是一个多项选择题问答数据集,旨在考察模型对常识知识的理解和推理能力。 数据集包含12,102个问题,每个问题有一个正确答案和四个干扰选项。...
    packageimg