找到11,679个数据集

标签: 自然语言处理

过滤结果
  • 全球电影评论情感分析数据集1963-2021

    2025年4月15日   

    全球电影评论情感分析数据集1963-2021 数据来源:互联网公开数据 标签:电影评论,情感分析,自然语言处理,预测分析,推荐系统,观众反馈,市场预测 数据概述:...
    packageimg
  • 社交媒体灾害相关推文清洗数据集

    2025年4月15日   

    社交媒体灾害相关推文清洗数据集 数据来源:互联网公开数据 标签:社交媒体, 灾害, 自然语言处理, 文本清洗, 拼写纠正, 数据增强, 文本分析, 机器学习 数据概述: 本数据集基于“Natural Language Processing with Disaster...
    packageimg
  • 汽车评论数据集

    2025年4月15日   

    汽车评论数据集 数据来源:互联网公开数据 标签:汽车评论,用户评价,自然语言处理,情感分析,产品反馈,消费者行为 数据概述: 本数据集包含用户对各种汽车的评论,记录了不同消费者对汽车性能、外观、油耗等方面的具体评价。数据集旨在提供有关汽车产品反馈的全面信息,可用于分析消费者对汽车产品的偏好和不满。 数据用途概述:...
    packageimg
  • LLM提示恢复与写作风格分析数据集

    2025年4月15日   

    LLM提示恢复与写作风格分析数据集 数据来源:互联网公开数据 标签:LLM,提示恢复,写作风格,自然语言处理,文本重写,竞赛数据,数据增强 数据概述:...
    packageimg
  • 推特用户文本分析性别分类数据集

    2025年4月15日   

    推特用户文本分析性别分类数据集 数据来源:互联网公开数据 标签:推特,文本分析,性别分类,自然语言处理,机器学习,统计分析,用户行为 数据概述: 本数据集包含推特用户的文本分析数据,涵盖推文文本、用户信息、置信度评分、个人资料日期等关键字段。数据集旨在研究推特用户在文本表达中出现拼写错误的频率与性别之间的关联,为性别与文本质量分析提供基础支持。...
    packageimg
  • 上下文词义推理数据集

    2025年4月15日   

    上下文词义推理数据集 数据来源:互联网公开数据 标签:词义推理,自然语言处理,语义关系,同义词,超义词,上下文分析,问答系统 数据概述: 本数据集提供了基于上下文的细粒度词义推理注释。数据集包含3,750个词对,每个词对都在一个上下文句子中出现,这些词对来自PPDB的一个子集。每个词对都被标注了在给定上下文中它们之间存在的语义关系。 数据用途概述:...
    packageimg
  • 博伽瓦坦歌数据集

    2025年4月15日   

    博伽瓦坦歌数据集 数据来源:互联网公开数据 标签:博伽瓦坦歌,梵文,哲学,宗教,文本分析,自然语言处理,文化研究 数据概述: 本数据集收录了《博伽瓦坦歌》的完整梵文文本,包含四个字段:索引、天城体文本、拉丁转写文本以及去除音变后的文本。数据集基于《博伽瓦坦歌如是我闻》版本,由A.C. Bhaktivedanta Swami...
    packageimg
  • 人类互动选择与拒绝数据集

    2025年4月15日   

    人类互动选择与拒绝数据集 数据来源:互联网公开数据 标签:人类互动,选择与拒绝,社交心理学,对话分析,行为模式,自然语言处理 数据概述:...
    packageimg
  • 耶路撒冷大使馆推文数据集

    2025年4月15日   

    耶路撒冷大使馆推文数据集 数据来源:互联网公开数据 标签:耶路撒冷大使馆,推特分析,政治,自然语言处理,情感分析,地理定位,数据可视化 数据概述:...
    packageimg
  • 滑铁卢大学课程评论数据集

    2025年4月15日   

    滑铁卢大学课程评论数据集 数据来源:互联网公开数据 标签:课程评论,滑铁卢大学,教学质量,学生反馈,自然语言处理,课程分类,机器学习 数据概述:...
    packageimg
  • 讽刺文本情感分析语料库数据集V2-讽刺文本分类数据集

    2025年4月15日   

    讽刺文本情感分析语料库数据集V2-讽刺文本分类数据集 数据来源:互联网公开数据 标签:讽刺,情感分析,文本分类,自然语言处理,语料库,机器学习,社交媒体,语言学 数据概述:...
    packageimg
  • 泰语文本处理数据集

    2025年4月15日   

    泰语文本处理数据集 数据来源:互联网公开数据 标签:自然语言处理,泰语,文本分析,语料库,语言研究,机器学习,数据稀缺,创业生态,商业分析,投资趋势,行业分布 数据概述: 本数据集旨在支持泰语文本处理和自然语言处理(NLP)研究。数据集包含泰...
    packageimg
  • AI与人类创作故事分类数据集

    2025年4月15日   

    AI与人类创作故事分类数据集 数据来源:互联网公开数据 标签:AI创作,人类创作,故事分类,文本分析,自然语言处理,机器学习 数据概述:...
    packageimg
  • 孟加拉语英语字母书写仇恨言论数据集

    2025年4月15日   

    孟加拉语英语字母书写仇恨言论数据集 数据来源:互联网公开数据 标签:孟加拉语,英语,仇恨言论,社交媒体,文本分析,自然语言处理,文化研究 数据概述:...
    packageimg
  • 约鲁巴语到英语机器翻译数据集

    2025年4月15日   

    约鲁巴语到英语机器翻译数据集 数据来源:互联网公开数据 标签:约鲁巴语,英语,机器翻译,低资源语言,自然语言处理,数据集,模型训练,多领域应用 数据概述:...
    packageimg
  • 流行语录作者分类数据集

    2025年4月15日   

    流行语录作者分类数据集 数据来源:互联网公开数据 标签:流行语录,作者分类,文本分类,自然语言处理,机器学习,数据科学 数据概述: 本数据集包含世界知名作家所写的流行语录,涵盖多个著名作家的作品。数据集由两列组成,第一列是作家撰写的语录,第二列是相应作家的姓名。该数据集适用于二元文本分类任务,旨在根据语录内容识别作者。 数据用途概述:...
    packageimg
  • 社交媒体情绪分析英语推文数据集-SemEval2018

    2025年4月15日   

    社交媒体情绪分析英语推文数据集-SemEval2018 数据来源:互联网公开数据 标签:推文,情感分析,情绪识别,自然语言处理,文本挖掘,社交媒体,英语,SemEval,NLP 数据概述: 本数据集源自SemEval-2018 Task...
    packageimg
  • AI问答FAQ搜索系统问题难度评估数据集

    2025年4月15日   

    AI问答FAQ搜索系统问题难度评估数据集 数据来源:互联网公开数据 标签:FAQ,问答系统,自然语言处理,问题难度,用户查询,机器学习,文本分析 数据概述: 本数据集由ai-...
    packageimg
  • arXiv人工智能研究论文元数据数据集-2024

    2025年4月15日   

    arXiv人工智能研究论文元数据数据集-2024 数据来源:互联网公开数据 标签:人工智能,AI,机器学习,深度学习,自然语言处理,计算机视觉,论文,研究,arXiv,元数据 数据概述: 本数据集收录了来自arXiv.org的10,000篇人工智能(AI)领域研究论文的元数据信息。数据集包含以下字段: * authors(作者):论文作者。 *...
    packageimg
  • 小学科学问题数据集

    2025年4月15日   

    小学科学问题数据集 数据来源:互联网公开数据 标签:小学科学,多选题,自然语言处理,问答系统,教育研究,人工智能,科学教育 数据概述: 本数据集包含7,787个小学科学水平的多选题,涵盖生物学、地质学、物理学、化学、天文学和环境科学等多个主题领域。数据集分为两个部分: 1. Easy...
    packageimg