找到16,243个数据集

标签: 自然语言处理

过滤结果
  • 印度及全球虚假与真实职位列表数据集1963-2021

    2025年4月15日   

    印度及全球虚假与真实职位列表数据集1963-2021 数据来源:互联网公开数据 标签:职位列表,印度,全球,虚假职位,真实职位,就业市场,自然语言处理 数据概述:...
    packageimg
  • 英国脱欧媒体舆论新闻文本数据集2016-2023

    2025年4月15日   

    英国脱欧媒体舆论新闻文本数据集2016-2023 数据来源:互联网公开数据 标签:英国脱欧,媒体舆论,文本分析,自然语言处理,新闻文本,舆论演变,主题建模 数据概述:...
    packageimg
  • 洋葱网讽刺新闻媒体内容数据集当前

    2025年4月15日   

    洋葱网讽刺新闻媒体内容数据集当前 数据来源:互联网公开数据 标签:讽刺新闻,洋葱网,媒体内容,自然语言处理,文本分类,数据分析 数据概述: 本数据集收录了洋葱网(The Onion)发布的讽刺新闻内容,包括新闻标题、发布时间及详细内容。数据集涵盖当前时间段内的新闻内容,展示了洋葱网独特的讽刺风格和媒体内容创作特点。 数据用途概述:...
    packageimg
  • 超级英雄API数据集

    2025年4月15日   

    超级英雄API数据集 数据来源:互联网公开数据 标签:超级英雄,漫画,数据集,角色信息,能力评估,电影,电视剧 数据概述: 本数据集收录了漫画宇宙中所有超级英雄的详细信息,涵盖了从经典角色到现代作品中的众多超级英雄。数据包括每个超级英雄的基本信息、能力、外貌特征、亲缘关系、工作信息等多维度内容,为研究超级英雄角色提供了全面的数据支持。 数据用途概述:...
    packageimg
  • 缅甸农业知识库数据集

    2025年4月15日   

    缅甸农业知识库数据集 数据来源:互联网公开数据 标签:缅甸农业,自然语言处理,指令调优语言模型,低资源语言,农作物,园艺,化学农药,植物病理学,气候变化,有机肥料 数据概述:...
    packageimg
  • 唐纳德-特朗普推特特质分析数据集1963-2021

    2025年4月15日   

    唐纳德-特朗普推特特质分析数据集1963-2021 数据来源:互联网公开数据 标签:特朗普,推特分析,性格特质,零样本分类,主动学习,情感分析,政治人物 数据概述:...
    packageimg
  • 数据2023年电影产业数据分析数据集

    2025年4月15日   

    数据2023年电影产业数据分析数据集 数据来源:互联网公开数据 标签:电影数据,电影产业,票房分析,预算预测,导演分析,演员分析,推荐系统,自然语言处理 数据概述: 本数据集收录了超过5000部电影的信息,包括预算、票房收入、演员阵容、导演、制作公司及电影类型等多方面特征。数据集涵盖了从热门到相对小众的电影,提供了电影产业的全面概述。数据收集自The...
    packageimg
  • 情感分析抑郁情绪识别数据集

    2025年4月15日   

    情感分析抑郁情绪识别数据集 数据来源:互联网公开数据 标签:情感分析,抑郁,情绪识别,文本数据,机器学习,自然语言处理,情感标签 数据概述: 本数据集包含文本数据,其中“text_id”列用于存储情感文本,而“is_depression”列则作为标签,用于指示该情感是否被归类为抑郁情绪。如果情感被判定为抑郁,则标签值为1;否则,标签值为0。...
    packageimg
  • Reddit宗教文本分类数据集

    2025年4月15日   

    Reddit宗教文本分类数据集 数据来源:互联网公开数据 标签:Reddit, 宗教, 文本分类, 自然语言处理, 社交媒体, 文本数据, 宗教信仰 数据概述:...
    packageimg
  • 喀拉拉邦政治观点YouTube评论多语言数据集

    2025年4月15日   

    喀拉拉邦政治观点YouTube评论多语言数据集 数据来源:互联网公开数据 标签:政治观点,YouTube评论,喀拉拉邦,多语言,英语,马拉雅拉姆语,Manglish,社交媒体分析,舆情分析 数据概述:...
    packageimg
  • 伊斯兰教圣训集锦رياضالصالحين圣训数据集中英双语版

    2025年4月15日   

    伊斯兰教圣训集锦رياضالصالحين圣训数据集中英双语版 数据来源:互联网公开数据 标签:圣训,伊斯兰教,宗教,经典,阿拉伯语,英语,文本数据,Hadith,Riyad as-Saliheen,GPT-3,GPT-4 数据概述: 本数据集收录了《 رياض الصالحين》(Riyad as-Saliheen)...
    packageimg
  • 顶级15款手机应用用户反馈数据集

    2025年4月15日   

    顶级15款手机应用用户反馈数据集 数据来源:互联网公开数据 标签:用户反馈,手机应用,自然语言处理,文本分类,主题建模,用户情感,用户偏好,趋势分析 数据概述:...
    packageimg
  • 韩国语词汇频率数据集

    2025年4月15日   

    韩国语词汇频率数据集 数据来源:互联网公开数据 标签:词汇频率,韩国语,自然语言处理,NLP,词频统计,语言学,语料库,词根分析,借词研究 数据概述 本数据集由韩国国立国语研究院(National Institute of the Korean...
    packageimg
  • 英语-法语翻译数据集

    2025年4月15日   

    英语-法语翻译数据集 数据来源:互联网公开数据 标签:机器翻译,自然语言处理,英语,法语,文本数据,语言对,翻译模型 数据概述: 本数据集包含138,000对英语-法语翻译的句子对。每对数据由一个英语句子及其对应的法语翻译构成。数据集提供了丰富的翻译实例,涵盖了多种主题和语言风格。 数据用途概述:...
    packageimg
  • 每日星座数据集

    2025年4月15日   

    每日星座数据集 数据来源:互联网公开数据 标签:星座,占星术,个性描述,情感匹配,时间序列,颜色趋势,动态数据 数据概述: 本数据集提供了每日不同星座的占星信息,包括个性描述、情感匹配等多方面内容。数据集还包含日期时间信息,支持进行时间序列分析,研究不同星座随时间变化的情绪和颜色趋势。 数据用途概述:...
    packageimg
  • 推特用户MBTI人格类型数据集

    2025年4月15日   

    推特用户MBTI人格类型数据集 数据来源:互联网公开数据 标签:推特用户,MBTI人格类型,文本分析,自然语言处理,机器学习,社交网络分析,行为特征,语言特征,网络特征 数据概述: 本数据集包含了8,328名推特用户的详细信息,这些用户在其个人资料中公开了他们的MBTI人格类型。数据集记录了每名用户的身份特征、行为特征、语言特征和网络特征。 -...
    packageimg
  • 美国非处方药OTC标签信息数据集-用于医学推荐应用-公开数据

    2025年4月15日   

    美国非处方药OTC标签信息数据集-用于医学推荐应用-公开数据 数据来源:互联网公开数据 标签:非处方药,OTC,药物标签,药品信息,FDA,医学应用,医疗健康,药物推荐 数据概述:...
    packageimg
  • 神奇宝贝数据集

    2025年4月15日   

    神奇宝贝数据集 数据来源:互联网公开数据 标签:神奇宝贝,宝可梦,游戏数据,战斗策略,统计信息,能力描述,进化路线 数据概述:...
    packageimg
  • 马来西亚加油站谷歌评价数据集

    2025年4月15日   

    马来西亚加油站谷歌评价数据集 数据来源:互联网公开数据 标签:加油站,马来西亚,谷歌评价,用户反馈,情感分析,地理坐标,数据抽取 数据概述: 本数据集通过Google Places...
    packageimg
  • 文学作品数字化研究书籍数据集

    2025年4月15日   

    文学作品数字化研究书籍数据集 数据来源:互联网公开数据 标签:数字图书馆,文学作品,文本分析,版权开放,文化研究,文本挖掘,语言学研究,文学史,经典文献,公共领域 数据概述: 本数据集收录了Project...
    packageimg