找到16,243个数据集

标签: 自然语言处理

过滤结果
  • IMDb电影评论情感分析数据集-2011至2021年

    2025年4月14日   

    IMDb电影评论情感分析数据集-2011至2021年 数据来源:互联网公开数据 标签:IMDb,电影评论,情感分析,自然语言处理,机器学习,Logistic回归,电影评分 数据概述: 本数据集收录了IMDb电影平台上的观众评论及评分数据,具体包括电影“in A Violent...
    packageimg
  • 垃圾邮件与正常邮件在推特评论中的数据集

    2025年4月14日   

    垃圾邮件与正常邮件在推特评论中的数据集 数据来源:互联网公开数据 标签:垃圾邮件,正常邮件,推特评论,特征分析,电子邮件分类,文本分析,社交媒体分析 数据概述: 本数据集收录了推特评论中收到的垃圾邮件和正常邮件的记录。数据集涵盖了大量推特评论样本,标注了每条评论是否包含垃圾邮件或正常邮件,为研究垃圾邮件特征和正常邮件特征提供了宝贵的数据基础。...
    packageimg
  • Reddit数据集元数据-Reddit数据集-r-datasets版块帖子与评论-创建至2022年3月1日

    2025年4月14日   

    Reddit数据集元数据-Reddit数据集-r-datasets版块帖子与评论-创建至2022年3月1日 数据来源:互联网公开数据 标签:Reddit,数据集,社交媒体,文本分析,情感分析,数据挖掘,时间序列,公共领域,帖子,评论 数据概述:...
    packageimg
  • Flipkart电商平台商品评论情感分析数据集

    2025年4月14日   

    Flipkart电商平台商品评论情感分析数据集 数据来源:互联网公开数据 标签:电商,评论,情感分析,用户反馈,商品评价,文本挖掘,自然语言处理,印度 数据概述:...
    packageimg
  • 印度加密货币禁令话题推特数据集2021

    2025年4月14日   

    印度加密货币禁令话题推特数据集2021 数据来源:互联网公开数据 标签:加密货币,印度,推特,禁令,投资,金融监管,公众舆论,时间序列,地理分布 数据概述:...
    packageimg
  • 肯尼亚社交媒体仇恨言论检测数据集-2017年肯尼亚大选期间

    2025年4月14日   

    肯尼亚社交媒体仇恨言论检测数据集-2017年肯尼亚大选期间 数据来源:互联网公开数据 标签:仇恨言论,社交媒体,肯尼亚,选举,多语言,代码切换,文本分类,自然语言处理,情感分析 数据概述:...
    packageimg
  • RSS新闻源集合-天空新闻与纽约时报

    2025年4月14日   

    RSS新闻源集合-天空新闻与纽约时报 数据来源:互联网公开数据 标签:新闻源,RSS,新闻分析,内容趋势,媒体研究,人工智能,自然语言处理,天空新闻,纽约时报,新闻类别,新闻描述,发布日期 数据概述:...
    packageimg
  • 网络聊天缩写与首字母缩略语数据集

    2025年4月14日   

    网络聊天缩写与首字母缩略语数据集 数据来源:互联网公开数据 标签:聊天缩写,首字母缩略语,网络用语,文本预处理,自然语言处理 数据概述: 本数据集包含了大量的网络聊天中的缩写、俚语及其对应的完整表达形式,涵盖了从Urban...
    packageimg
  • 罗马化乌都语女性卫生与健康聊天机器人数据集

    2025年4月14日   

    罗马化乌都语女性卫生与健康聊天机器人数据集 数据来源:互联网公开数据 标签:女性卫生,健康咨询,聊天机器人,自然语言处理,罗马化乌都语,健康教育,对话系统 数据概述: 本数据集由哈比大学团队Mai作为毕业设计项目的一部分构建,旨在通过创建一个基于Transformer的聊天机器人来解决女性卫生和健康相关问题。数据集来源于多个来源,包括Hello...
    packageimg
  • 古兰经与圣训数据集1963-2021

    2025年4月14日   

    古兰经与圣训数据集1963-2021 数据来源:互联网公开数据 标签:古兰经,圣训,宗教,伊斯兰教,阿拉伯语,文本数据,宗教研究 数据概述:...
    packageimg
  • 罗马尼亚语语法分析语料库1963-2021

    2025年4月14日   

    罗马尼亚语语法分析语料库1963-2021 数据来源:互联网公开数据 标签:罗马尼亚语,语料库,语法分析,自然语言处理,UD树库 数据概述: 本数据集是罗马尼亚语的通用依存树库(Universal Dependencies Romanian-...
    packageimg
  • 好读网站百页精选名言数据集

    2025年4月14日   

    好读网站百页精选名言数据集 数据来源:互联网公开数据 标签:名言,好读网站,文学,引用,分类,流行,点赞数 数据概述: 本数据集收录了来自好读网站的100页精选名言,涵盖多个领域的经典引用。数据包括名言的具体内容、作者信息、所属类别标签以及每个引用获得的点赞数,为研究流行文化和文学作品提供了丰富的文本资源。 数据用途概述:...
    packageimg
  • 碧梨BillieEilishSpotify歌曲分析数据集

    2025年4月14日   

    碧梨BillieEilishSpotify歌曲分析数据集 数据来源:互联网公开数据 标签:音乐,Spotify,碧梨,歌曲分析,音质特征,流行度,歌词,数据分析 数据概述: 本数据集包含了碧梨(Billie Eilish)在Spotify上的歌曲相关信息,涵盖了歌曲的音质特征、流行度以及歌词数据。数据集主要由两个CSV文件组成: 1....
    packageimg
  • IMDB电影描述数据集1960-2023

    2025年4月14日   

    IMDB电影描述数据集1960-2023 数据来源:互联网公开数据 标签:电影,IMDB,电影描述,电影分类,电影行业,版权声明,数据分析 数据概述:...
    packageimg
  • 印度女性服装分类自然语言处理数据集1963-2021

    2025年4月14日   

    印度女性服装分类自然语言处理数据集1963-2021 数据来源:互联网公开数据 标签:女性服装,分类,自然语言处理,电商评论,情感分析,推荐系统,零售分析 数据概述:...
    packageimg
  • IT技能从职位数据集

    2025年4月14日   

    IT技能从职位数据集 数据来源:互联网公开数据 标签:职位描述,IT技能,软技能,教育背景,工作经验,技能提取,自然语言处理 数据概述: 本数据集包含了各类职位的详细描述,包括所需的IT技能、软技能、教育背景和工作经验等信息。数据中的硬技能部分由职位描述中的IT相关关键词构成,可以用于训练语言模型,帮助从各种IT职位描述中提取技能信息。 数据用途概述:...
    packageimg
  • 印地语情感分析数据集

    2025年4月14日   

    印地语情感分析数据集 数据来源:互联网公开数据 标签:印地语,情感分析,NLP,自然语言处理,机器学习,情感分类,情绪识别 数据概述: 本数据集包含约8000条用印地语编写的句子,这些句子被分类为七个标签:中性、惊讶、恐惧、悲伤、快乐、厌恶和愤怒。该数据集为印地语句子的情感分析提供了基础,适用于自然语言处理或序列学习模型的应用。 数据用途概述:...
    packageimg
  • 俄罗斯乌克兰战争社交媒体情感分析数据集

    2025年4月14日   

    俄罗斯乌克兰战争社交媒体情感分析数据集 数据来源:互联网公开数据 标签:社交媒体,情感分析,俄罗斯乌克兰战争,公众意见,文本分析,TextBlob,文本情感,国际关系 数据概述: 本数据集通过提取Twitter上的特定标签收集了关于俄罗斯乌克兰战争及其全球公众情感的推文数据。选取的标签包括ukrainewar, russianattack,...
    packageimg
  • Reddit新闻板块用户参与度与话题流行度趋势分析数据集

    2025年4月14日   

    Reddit新闻板块用户参与度与话题流行度趋势分析数据集 数据来源:互联网公开数据 标签:Reddit,新闻,用户参与,话题流行,社区分析,社交媒体,数据科学,研究 数据概述:...
    packageimg
  • 灾害相关推文自然语言处理数据集

    2025年4月14日   

    灾害相关推文自然语言处理数据集 数据来源:互联网公开数据 标签:自然语言处理,NLP,灾害,推文,文本分类,机器学习,情感分析,事件检测 数据概述: 本数据集包含来自Kaggle的“Disaster...
    packageimg