找到11,679个数据集

标签: 自然语言处理

过滤结果
  • 动物与萨马巴杜尔电影推特情感分析数据集

    2025年4月15日   

    动物与萨马巴杜尔电影推特情感分析数据集 数据来源:互联网公开数据 标签:电影推特,情感分析,自然语言处理,文本挖掘,动物,萨马巴杜尔,公众意见 数据概述: 本数据集包含与电影“动物”和“萨马巴杜尔”相关的推特集合,从Twitter公共API提取。每个数据条目代表一条单独的推特,未附带情感标签。 数据格式: 文件格式:CSV 列:单列包含原始推特文本...
    packageimg
  • 俄罗斯语言设备评论情感分析数据集

    2025年4月15日   

    俄罗斯语言设备评论情感分析数据集 数据来源:互联网公开数据 标签:评论分析,情感分析,俄罗斯语言,设备评价,文本挖掘,自然语言处理 数据概述:...
    packageimg
  • 包含-机器学习-关键词的推文数据集

    2025年4月15日   

    包含-机器学习-关键词的推文数据集 数据来源:互联网公开数据 标签:推文,机器学习,社交媒体分析,自然语言处理,文本挖掘 数据概述: 本数据集收录了在推特平台上包含日语关键词“機械学習”(机器学习)的相关推文记录。数据包括推文的发布时间、作者信息、推文内容等关键字段,为研究机器学习领域的社交媒体讨论提供了丰富的数据资源。 数据用途概述:...
    packageimg
  • 土耳其社交媒体文本数据集

    2025年4月15日   

    土耳其社交媒体文本数据集 数据来源:互联网公开数据 标签:社交媒体,文本分析,网络欺凌,情感分析,自然语言处理,土耳其语,机器学习 数据概述:...
    packageimg
  • 星巴克评论数据集

    2025年4月15日   

    星巴克评论数据集 数据来源:互联网公开数据 标签:星巴克,评论,情感分析,自然语言处理,文本分类,数据清洗,商业分析 数据概述: 本数据集包含700条星巴克评论数据,涵盖5个字段:用户名称、位置、日期、评分和评论内容。评论内容为原始文本,未经过预处理。数据集旨在为自然语言处理任务提供基础数据支持,适用于情感分析、文本分类等场景。 数据用途概述:...
    packageimg
  • 俄罗斯敏感话题不适当言论数据集

    2025年4月15日   

    俄罗斯敏感话题不适当言论数据集 数据来源:互联网公开数据 标签:敏感话题,不适当言论,网络言论,俄罗斯,自然语言处理,文本分析,社会学研究 数据概述: 本数据集专注于收集和分析涉及敏感话题的不适当言论,这些言论可能引起读者的不适或损害发言者的声誉。不适当性概念接近于毒性,但明确的毒性和明显的...
    packageimg
  • 写作质量分析文本变化补充数据集

    2025年4月15日   

    写作质量分析文本变化补充数据集 数据来源:互联网公开数据 标签:写作质量,文本变化,竞赛数据,学术研究,自然语言处理,数据补充,文本分析 数据概述:...
    packageimg
  • 土耳其新闻文章数据集2017-2021

    2025年4月15日   

    土耳其新闻文章数据集2017-2021 数据来源:互联网公开数据 标签:土耳其新闻,文章数据,自然语言处理,停用词,作者分析,时间序列,新闻研究 数据概述:...
    packageimg
  • 基因组生物医学事件数据集

    2025年4月15日   

    基因组生物医学事件数据集 数据来源:互联网公开数据 标签:生物医学文本,事件标注,自然语言处理,NLP,药物效果分析,医学条件识别,数据集简化版 数据概述: 本数据集是GENIA事件标注数据集的简化版本,来源于TEES平台,基于BioNLP共享任务2011(BioNLP Shared Task...
    packageimg
  • 多轮对话提示数据集

    2025年4月15日   

    多轮对话提示数据集 数据来源:互联网公开数据 标签:多轮对话,文本数据,自然语言处理,机器学习,对话系统,数据标注,人工智能聊天机器人 数据概述:...
    packageimg
  • LinkedIn职位招聘信息数据集-2024年

    2025年4月15日   

    LinkedIn职位招聘信息数据集-2024年 数据来源:互联网公开数据 标签:LinkedIn,招聘,职位,就业,数据分析,自然语言处理,文本挖掘,职位描述 数据概述: 本数据集来源于LinkedIn网站的职位招聘信息抓取结果,包含了多个关键字段,用于深入分析职位招聘趋势和就业市场动态。数据主要包含以下字段:...
    packageimg
  • Quora平台重复问题识别数据集

    2025年4月15日   

    Quora平台重复问题识别数据集 数据来源:互联网公开数据 标签:Quora,问答平台,重复问题,自然语言处理,文本相似度,数据挖掘,用户体验 数据概述:...
    packageimg
  • 立场检测多领域用户观点数据集2021

    2025年4月15日   

    立场检测多领域用户观点数据集2021 数据来源:互联网公开数据 标签:立场检测,自然语言处理,社交媒体分析,情感分析,讽刺检测,COVID-19疫苗,数字转型,女性赋权 数据概述:...
    packageimg
  • 新闻文章摘要数据集

    2025年4月15日   

    新闻文章摘要数据集 数据来源:互联网公开数据 标签:新闻,文章,摘要,标题,超链接,内容,文本分析,自然语言处理 数据概述: 本数据集包含了新闻文章的标题、超链接和正文内容。数据集覆盖了广泛的新闻来源,提供了丰富的文本信息,适用于新闻分析、文本摘要生成和自然语言处理等多种应用场景。 数据用途概述:...
    packageimg
  • 基于文本的分类数据集

    2025年4月15日   

    基于文本的分类数据集 数据来源:互联网公开数据 标签:文本分类,区块链,机器学习,自然语言处理,数据标注,监督学习,领域特定文本 数据概述 本数据集旨在基于文本内容对样本进行分类,数据来源于区块链领域相关的文本资料。数据集包含两部分内容: -...
    packageimg
  • 电影壮志凌云2-独行侠影评情感分析数据集-2022年

    2025年4月15日   

    电影壮志凌云2-独行侠影评情感分析数据集-2022年 数据来源:互联网公开数据 标签:电影,影评,情感分析,自然语言处理,NLP,好莱坞,票房,评论,观众反馈 数据概述: 本数据集包含电影《壮志凌云2:独行侠》(Top Gun:...
    packageimg
  • 恐怖小说作者识别数据集

    2025年4月15日   

    恐怖小说作者识别数据集 数据来源:互联网公开数据 标签:恐怖小说,作者识别,文本分析,机器学习,自然语言处理 数据概述: 本数据集包含多篇由不同恐怖小说作者撰写的文本样本,旨在用于作者识别任务。数据集涵盖了多位著名恐怖小说作者的作品,每篇文本均标注了相应的作者身份,为研究和开发作者识别模型提供了丰富的训练和测试材料。 数据用途概述:...
    packageimg
  • 阿拉伯语指令与响应文化相关性研究数据集

    2025年4月15日   

    阿拉伯语指令与响应文化相关性研究数据集 数据来源:互联网公开数据 标签:阿拉伯语指令,文化相关性,语言模型训练,自然语言处理,跨文化研究,人工智能,机器学习 数据概述:...
    packageimg
  • Eedi数学竞赛学生解题思维链增强数据集-2023

    2025年4月15日   

    Eedi数学竞赛学生解题思维链增强数据集-2023 数据来源:互联网公开数据 标签:Eedi,数学,思维链,ChatGPT,增强,竞赛,教育,机器学习,自然语言处理 数据概述: 本数据集是Eedi数学竞赛数据的思维链(Chain-of-Thought,...
    packageimg
  • 全球社交平台Pinterest热门内容数据集

    2025年4月15日   

    全球社交平台Pinterest热门内容数据集 数据来源:互联网公开数据 标签:内容分析, 图像分析, 自然语言处理, 社交媒体, 趋势分析, 图网络分析 数据集简介: 本数据集汇总了Pinterest平台上高人气内容(Pins)的结构化信息,包含图像内容、文本描述、标题信息与受欢迎程度(Repin次数)等关键指标。该数据集由Oneli...
    packageimg