找到11,688个数据集

标签: 自然语言处理

过滤结果
  • 印度短信垃圾信息与正常信息分类数据集

    2025年4月14日   

    印度短信垃圾信息与正常信息分类数据集 数据来源:互联网公开数据 标签:短信,垃圾信息,文本分类,自然语言处理,数据分析,机器学习,信息过滤 数据概述:...
    packageimg
  • 印度医疗问答数据集1963-2021

    2025年4月14日   

    印度医疗问答数据集1963-2021 数据来源:互联网公开数据 标签:医疗问答,印度,健康,数据集,自然语言处理,机器学习,医疗研究 数据概述: 本数据集包含10045条记录,源自MedQuad医疗问答数据集,涵盖了广泛的医疗问题和答案。数据内容涉及不同医学领域,为医疗研究、问答系统开发和自然语言处理提供了丰富的资源。 数据用途概述:...
    packageimg
  • 推特情感分析百万级推文数据集-情感倾向分析-2024

    2025年4月14日   

    推特情感分析百万级推文数据集-情感倾向分析-2024 数据来源:互联网公开数据 标签:推特,情感分析,推文,文本数据,情感倾向,自然语言处理,机器学习,情感分类 数据概述:...
    packageimg
  • 推文情感提取扩展数据集

    2025年4月14日   

    推文情感提取扩展数据集 数据来源:互联网公开数据 标签:情感分析,推文,自然语言处理,NLP,扩展数据,特征提取,文本分析,数据处理 数据概述:...
    packageimg
  • 综合园艺维基数据集

    2025年4月14日   

    综合园艺维基数据集 数据来源:互联网公开数据 标签:园艺,维基,植物学,合成数据,语义分离,自然语言处理,测试数据,机器学习 数据概述: 本数据集是一个实验性的合成数据集,基于小型维基百科中关于园艺和植物学的条目集合。数据内容由Claude...
    packageimg
  • BBC新闻文本分类与主题分析数据集2004-2005

    2025年4月14日   

    BBC新闻文本分类与主题分析数据集2004-2005 数据来源:互联网公开数据 标签:新闻分类,文本挖掘,自然语言处理,BBC新闻,分类模型,主题分析,语言处理技术 数据概述:...
    packageimg
  • 推特用户性别预测数据集

    2025年4月14日   

    推特用户性别预测数据集 数据来源:互联网公开数据 标签:推特,性别预测,自然语言处理,机器学习,文本分析,社会语言学,性别识别 数据概述: 本数据集包含2019年5月21日至2019年6月1日期间通过Twitter...
    packageimg
  • 摩门经信息提取版数据集

    2025年4月14日   

    摩门经信息提取版数据集 数据来源:互联网公开数据 标签:摩门经,宗教文本,自然语言处理,主题建模,文本研究,文化研究 数据概述: 该数据集包含了《摩门经》的文本内容,该文本来源于美国在线图书馆的Project...
    packageimg
  • 越南语关系抽取数据集

    2025年4月14日   

    越南语关系抽取数据集 数据来源:互联网公开数据 标签:越南语,自然语言处理,关系抽取,实体识别,文本分析,机器学习,语义理解 数据概述:...
    packageimg
  • 科学问答数据集-物理-化学-生物等多学科知识测试数据集

    2025年4月14日   

    科学问答数据集-物理-化学-生物等多学科知识测试数据集 数据来源:互联网公开数据 标签:科学,问答,教育,考试,物理,化学,生物,多选题,机器学习,自然语言处理 数据概述:...
    packageimg
  • 新冠患者临床描述文本生成数据集

    2025年4月14日   

    新冠患者临床描述文本生成数据集 数据来源:互联网公开数据 标签:新冠,患者,临床,描述,文本生成,自然语言处理,医疗,疫情 数据概述: 本数据集包含了从CoronaWhy-Task-TIES项目生成的患者临床描述文本。这些文本由特定的notebook处理生成,旨在为新冠患者提供临床信息。数据集是该notebook最近一次成功运行的输出结果。...
    packageimg
  • 印地语等多种语言Quora问答对数据集

    2025年4月14日   

    印地语等多种语言Quora问答对数据集 数据来源:互联网公开数据 标签:问答对, Quora, 多语言, 印地语, 奥里亚语, 孟加拉语, 古吉拉特语, 马拉地语, 泰米尔语, 旁遮普语, 自然语言处理, 文本分析 数据概述: 本数据集包含3300对来自原始Quora问答对数据集的问答对。...
    packageimg
  • 阿拉伯语仇恨言论检测数据集-42k

    2025年4月14日   

    阿拉伯语仇恨言论检测数据集-42k 数据来源:互联网公开数据 标签:阿拉伯语,仇恨言论,社交媒体,文本分析,自然语言处理,情感分析,语言学,机器学习 数据概述: 本数据集包含超过42,000条阿拉伯语文本数据,主要来源于社交媒体平台。 数据集旨在为研究和开发阿拉伯语仇恨言论检测模型提供支持。...
    packageimg
  • 垃圾邮件预测数据集

    2025年4月14日   

    垃圾邮件预测数据集 数据来源:互联网公开数据 标签:垃圾邮件,电子邮件分类,自然语言处理,机器学习,文本分析,数据清洗 数据概述:...
    packageimg
  • 电影评论情感分析研究数据集2023年6月版

    2025年4月14日   

    电影评论情感分析研究数据集2023年6月版 数据来源:互联网公开数据 标签:电影评论,情感分析,自然语言处理,IMDB,用户评价,数据挖掘 数据概述:...
    packageimg
  • IMDB顶级电影评论文本情感分析数据集

    2025年4月14日   

    IMDB顶级电影评论文本情感分析数据集 数据来源:互联网公开数据 标签:IMDB, 电影评论, 情感分析, 自然语言处理, 文本数据, 评分, 电影, 评论 数据概述: 本数据集包含了IMDB(互联网电影数据库)上评分最高的10部电影的评论数据,旨在为自然语言处理(NLP)相关研究提供支持。数据集中每条记录包含以下字段: 电影名称:评论对应的电影名称。...
    packageimg
  • 情绪预测数据集

    2025年4月14日   

    情绪预测数据集 数据来源:互联网公开数据 标签:情绪预测, WhatsApp状态,自然语言处理,情感分析,机器学习,文本清理,情感分类 数据概述:...
    packageimg
  • 白雪公主真人版预告片观众评论数据集

    2025年4月14日   

    白雪公主真人版预告片观众评论数据集 数据来源:互联网公开数据 标签:评论数据,情感分析,电影预告片,观众反馈,多语言评论,社交媒体数据,自然语言处理 数据概述:...
    packageimg
  • 俄语关系抽取Rebel数据集去重合并版

    2025年4月14日   

    俄语关系抽取Rebel数据集去重合并版 数据来源:互联网公开数据 标签:俄语,关系抽取,自然语言处理,文本数据,机器学习,Rebel,数据集,语言模型 数据概述: 本数据集为俄语版Rebel数据集,用于关系抽取任务。原始数据集由Hugging...
    packageimg
  • 土耳其用户产品评论数据集2023

    2025年4月14日   

    土耳其用户产品评论数据集2023 数据来源:互联网公开数据 标签:土耳其评论,在线消费者,产品评价,自然语言处理,词嵌入,电子商务,机器学习 数据概述: 本数据集收录了在土耳其电商平台上的顾客对多种产品(包括电脑、茶机、耳机、调制解调器、香水、手机、电视和USB设备)的评论,评论内容均为土耳其语。该数据集由土耳其伊斯坦布尔科技大学的Ekin...
    packageimg