找到11,969个数据集

标签: 自然语言处理

过滤结果
  • 电商平台用户评论情感与主题分类数据集1963-2021

    2025年4月15日   

    电商平台用户评论情感与主题分类数据集1963-2021 数据来源:互联网公开数据 标签:用户评论,情感分析,主题分类,电商平台,数据挖掘,机器学习,自然语言处理 数据概述:...
    packageimg
  • 职位描述分类任务数据集

    2025年4月15日   

    职位描述分类任务数据集 数据来源:互联网公开数据 标签:职位描述,分类任务,机器学习,自然语言处理,文本分析,人力资源管理 数据概述: 本数据集包含多个职位描述的文本样本,每个样本均标注有对应的分类标签。数据集内容涵盖各种行业和岗位的职位描述,旨在为构建职位描述分类任务提供高质量的训练数据。 数据用途概述:...
    packageimg
  • 职位技能集数据集

    2025年4月15日   

    职位技能集数据集 数据来源:互联网公开数据 标签:职位技能,招聘,技能提取,自然语言处理,职位匹配,推荐系统,行业分析 数据概述: 职位技能集数据集旨在用于与职位匹配、技能提取和自然语言处理相关的机器学习项目。数据集包含了职位角色、描述及其相关技能集的详细信息,使开发者和研究者能够构建和评估职业生涯推荐系统、简历解析和技能推断的模型。...
    packageimg
  • 每日韩语对话数据集2017-2020

    2025年4月15日   

    每日韩语对话数据集2017-2020 数据来源:互联网公开数据 标签:韩语学习,对话数据,双语对照,教育工具,语言研究,文本挖掘,自然语言处理 数据概述: 本数据集包含了2017年12月4日至2020年8月19日期间,从Naver Dictionary每日对话栏目中提取的韩语-...
    packageimg
  • 知识符号关联与大语言模型数据集

    2025年4月15日   

    知识符号关联与大语言模型数据集 数据来源:互联网公开数据 标签:知识符号关联,大语言模型,LLM,机器学习,自然语言处理,提示生成,知识表示 数据概述:...
    packageimg
  • 推特情感分析数据集2021

    2025年4月15日   

    推特情感分析数据集2021 数据来源:互联网公开数据 标签:推特,情感分析,社交媒体,文本分析,自然语言处理,机器学习 数据概述:...
    packageimg
  • 种族歧视检测数据集

    2025年4月15日   

    种族歧视检测数据集 数据来源:互联网公开数据 标签:种族歧视,评论分析,自然语言处理,情感分析,偏见检测,机器学习,数据清洗 数据概述:...
    packageimg
  • 推特情感分析竞赛伪标签推文数据集-2020年

    2025年4月15日   

    推特情感分析竞赛伪标签推文数据集-2020年 数据来源:互联网公开数据 标签:推特,情感分析,自然语言处理,伪标签,文本分类,竞赛,机器学习,社交媒体 数据概述:...
    packageimg
  • Reddit印度板块帖子标签预测数据集-2024

    2025年4月15日   

    Reddit印度板块帖子标签预测数据集-2024 数据来源:互联网公开数据 标签:Reddit,印度,社交媒体,文本分析,机器学习,自然语言处理,标签预测,内容分类,PRAW API 数据概述: 本数据集来源于Reddit社交平台上的r/india子版块,通过PRAW...
    packageimg
  • 俄罗斯传记文本语料库1963-2021

    2025年4月15日   

    俄罗斯传记文本语料库1963-2021 数据来源:互联网公开数据 标签:传记文本,俄罗斯,自然语言处理,文本挖掘,生物信息提取,主题分类 数据概述:...
    packageimg
  • 科学文献关键词分析数据集1963-2021

    2025年4月15日   

    科学文献关键词分析数据集1963-2021 数据来源:互联网公开数据 标签:科学文献,关键词,作者关键词,自动关键词,Web of Science,文本分析,自然语言处理 数据概述: 本数据集包含了从Web of Science...
    packageimg
  • 动物与萨马巴杜尔电影推特情感分析数据集

    2025年4月15日   

    动物与萨马巴杜尔电影推特情感分析数据集 数据来源:互联网公开数据 标签:电影推特,情感分析,自然语言处理,文本挖掘,动物,萨马巴杜尔,公众意见 数据概述: 本数据集包含与电影“动物”和“萨马巴杜尔”相关的推特集合,从Twitter公共API提取。每个数据条目代表一条单独的推特,未附带情感标签。 数据格式: 文件格式:CSV 列:单列包含原始推特文本...
    packageimg
  • 俄罗斯语言设备评论情感分析数据集

    2025年4月15日   

    俄罗斯语言设备评论情感分析数据集 数据来源:互联网公开数据 标签:评论分析,情感分析,俄罗斯语言,设备评价,文本挖掘,自然语言处理 数据概述:...
    packageimg
  • 包含-机器学习-关键词的推文数据集

    2025年4月15日   

    包含-机器学习-关键词的推文数据集 数据来源:互联网公开数据 标签:推文,机器学习,社交媒体分析,自然语言处理,文本挖掘 数据概述: 本数据集收录了在推特平台上包含日语关键词“機械学習”(机器学习)的相关推文记录。数据包括推文的发布时间、作者信息、推文内容等关键字段,为研究机器学习领域的社交媒体讨论提供了丰富的数据资源。 数据用途概述:...
    packageimg
  • 土耳其社交媒体文本数据集

    2025年4月15日   

    土耳其社交媒体文本数据集 数据来源:互联网公开数据 标签:社交媒体,文本分析,网络欺凌,情感分析,自然语言处理,土耳其语,机器学习 数据概述:...
    packageimg
  • 星巴克评论数据集

    2025年4月15日   

    星巴克评论数据集 数据来源:互联网公开数据 标签:星巴克,评论,情感分析,自然语言处理,文本分类,数据清洗,商业分析 数据概述: 本数据集包含700条星巴克评论数据,涵盖5个字段:用户名称、位置、日期、评分和评论内容。评论内容为原始文本,未经过预处理。数据集旨在为自然语言处理任务提供基础数据支持,适用于情感分析、文本分类等场景。 数据用途概述:...
    packageimg
  • 俄罗斯敏感话题不适当言论数据集

    2025年4月15日   

    俄罗斯敏感话题不适当言论数据集 数据来源:互联网公开数据 标签:敏感话题,不适当言论,网络言论,俄罗斯,自然语言处理,文本分析,社会学研究 数据概述: 本数据集专注于收集和分析涉及敏感话题的不适当言论,这些言论可能引起读者的不适或损害发言者的声誉。不适当性概念接近于毒性,但明确的毒性和明显的...
    packageimg
  • 写作质量分析文本变化补充数据集

    2025年4月15日   

    写作质量分析文本变化补充数据集 数据来源:互联网公开数据 标签:写作质量,文本变化,竞赛数据,学术研究,自然语言处理,数据补充,文本分析 数据概述:...
    packageimg
  • 土耳其新闻文章数据集2017-2021

    2025年4月15日   

    土耳其新闻文章数据集2017-2021 数据来源:互联网公开数据 标签:土耳其新闻,文章数据,自然语言处理,停用词,作者分析,时间序列,新闻研究 数据概述:...
    packageimg
  • 基因组生物医学事件数据集

    2025年4月15日   

    基因组生物医学事件数据集 数据来源:互联网公开数据 标签:生物医学文本,事件标注,自然语言处理,NLP,药物效果分析,医学条件识别,数据集简化版 数据概述: 本数据集是GENIA事件标注数据集的简化版本,来源于TEES平台,基于BioNLP共享任务2011(BioNLP Shared Task...
    packageimg