找到11,966个数据集

标签: 自然语言处理

过滤结果
  • Reddit平台政治观点讨论分析数据集-自由派与保守派-13000条帖子

    2025年4月15日   

    Reddit平台政治观点讨论分析数据集-自由派与保守派-13000条帖子 数据来源:互联网公开数据 标签:Reddit,政治,观点分析,自由派,保守派,文本数据,社交媒体,NLP,自然语言处理 数据概述:...
    packageimg
  • 推特用户情感分析数据集-社交媒体互动与情感洞察-2023年

    2025年4月15日   

    推特用户情感分析数据集-社交媒体互动与情感洞察-2023年 数据来源:互联网公开数据 标签:推特,情感分析,社交媒体,文本挖掘,自然语言处理,用户行为,情感倾向,舆情分析 数据概述:...
    packageimg
  • 多语言大型语言模型生成文本数据集1963-2021

    2025年4月15日   

    多语言大型语言模型生成文本数据集1963-2021 数据来源:互联网公开数据 标签:大型语言模型,多语言,文本生成,机器学习,自然语言处理,人工智能,深度学习,神经网络,数据科学,文本分类,语言理解,文本挖掘 数据概述:...
    packageimg
  • 尼泊尔语社交媒体情感分析数据集

    2025年4月15日   

    尼泊尔语社交媒体情感分析数据集 数据来源:互联网公开数据 标签:情感分析,自然语言处理,尼泊尔语,社交媒体,文本分类,情感,NLP,机器学习 数据概述: 本数据集包含尼泊尔语社交媒体文本,并标注了情感极性。情感标签分为三类:积极(1),消极(0),和中性(2)。数据集来源于Hugging Face Datasets...
    packageimg
  • 社交媒体情感分析数据集-用户评论情感分类-训练与评估-公开

    2025年4月15日   

    社交媒体情感分析数据集-用户评论情感分类-训练与评估-公开 数据来源:互联网公开数据 标签:情感分析,自然语言处理,社交媒体,用户评论,文本分类,机器学习,情感分类,正负中性 数据概述: 本数据集旨在支持社交媒体情感分析任务,涵盖了用户评论的情感倾向分类。数据集包含训练集、开发集和测试集,用于模型的训练、验证和评估。...
    packageimg
  • 多语言医学问答数据集MedQA-4K数据集

    2025年4月15日   

    多语言医学问答数据集MedQA-4K数据集 数据来源:互联网公开数据 标签:医学,问答,多语言,自然语言处理,机器学习,英语,中文,韩语,医疗,数据集 数据概述: 本数据集源于MedQA数据集,并精心挑选了多选题形式的医学问题。该数据集专为多语言自然语言处理和微调语言模型而设计。 关键特征: 语言分布:...
    packageimg
  • 斯里兰卡麻醉药品法问答数据集

    2025年4月15日   

    斯里兰卡麻醉药品法问答数据集 数据来源:互联网公开数据 标签:斯里兰卡,麻醉药品法,问答数据集,法律文本分析,自然语言处理,法律信息抽取 数据概述:...
    packageimg
  • LLM提示恢复数据集800个提示

    2025年4月15日   

    LLM提示恢复数据集800个提示 数据来源:互联网公开数据 标签:LLM,提示恢复,自然语言处理,机器学习,竞赛数据,文本生成,人工智能 数据概述: 本数据集为LLM提示恢复竞赛而创建,包含了800个精心设计的语言模型提示。这些提示涵盖了多种应用场景和主题,旨在用于评估和改进语言模型的提示恢复能力。数据集中的每个提示都经过仔细设计,确保多样性和代表性。...
    packageimg
  • 松下印度员工评论数据集

    2025年4月15日   

    松下印度员工评论数据集 数据来源:互联网公开数据 标签:松下,印度,员工评论,工作环境,职业生涯,公司文化,数据分析,情感分析,自然语言处理 数据概述: 松下印度员工评论数据集是从Ambition Box平台收集的员工对松下印度公司的工作体验和评价。Ambition...
    packageimg
  • 多任务学习社交媒体情感分析多语言数据集

    2025年4月15日   

    多任务学习社交媒体情感分析多语言数据集 数据来源:互联网公开数据 标签:多任务学习,情感分析,多语言,自然语言处理,社交媒体,CSV数据 数据概述:...
    packageimg
  • 波斯语文本蕴含推理数据集FarsTail

    2025年4月15日   

    波斯语文本蕴含推理数据集FarsTail 数据来源:互联网公开数据 标签:自然语言处理,文本蕴含,NLI,波斯语,波斯文,Farsi,数据集,机器翻译,语言学 数据概述:...
    packageimg
  • 北马里亚纳情绪数据集

    2025年4月15日   

    北马里亚纳情绪数据集 数据来源:互联网公开数据 标签:情绪分析,北马里亚纳,社交媒体,情感分类,文本分析,自然语言处理 数据概述:...
    packageimg
  • 垃圾邮件分类文本数据集

    2025年4月15日   

    垃圾邮件分类文本数据集 数据来源:互联网公开数据 标签:垃圾邮件,文本分类,二元分类,机器学习,数据标注,自然语言处理 数据概述:...
    packageimg
  • 命名实体识别数据集

    2025年4月15日   

    命名实体识别数据集 数据来源:互联网公开数据 标签:命名实体识别,自然语言处理,预训练语言模型,文本标注,机器学习,数据科学,Kaggle数据集 数据概述: 本数据集主要用于运行基于预训练语言模型的命名实体识别(NER)任务的笔记本。数据集包含三个关键字段:1. 文本内容(Text),2. 实体标注(Labels),3....
    packageimg
  • 乌克兰在线购物用户反馈数据集

    2025年4月15日   

    乌克兰在线购物用户反馈数据集 数据来源:互联网公开数据 标签:用户反馈,在线购物,乌克兰,自然语言处理,数据分析,消费者意见,电子商务 数据概述:...
    packageimg
  • 乌尔都-普什图双语词典数据集

    2025年4月15日   

    乌尔都-普什图双语词典数据集 数据来源:互联网公开数据 标签:乌尔都语,普什图语,双语词典,自然语言处理,机器翻译,语言研究 数据概述: 乌尔都-...
    packageimg
  • YALICKJ维基百科带上下文数据集

    2025年4月15日   

    YALICKJ维基百科带上下文数据集 数据来源:互联网公开数据 标签:维基百科,上下文,数据集,自然语言处理,机器学习,文本分析 数据概述: 本数据集基于YALICKJ在Kaggle上提供的维基百科数据集,并增加了由Chris Notebook生成的上下文列。数据集包含了维基百科页面的文本内容及其对应的上下文信息,适用于自然语言处理和机器学习任务。...
    packageimg
  • 美国国家科学基金会自然语言处理活跃奖项数据集

    2025年4月15日   

    美国国家科学基金会自然语言处理活跃奖项数据集 数据来源:互联网公开数据 标签:自然语言处理,NSF,科研资助,项目申请,技术趋势,学术研究,资金分配 数据概述:...
    packageimg
  • ACL论文集摘要数据集2016-2018

    2025年4月15日   

    ACL论文集摘要数据集2016-2018 数据来源:互联网公开数据 标签:ACL,论文摘要,自然语言处理,EMNLP,学术研究 数据概述: 本数据集收录了ACL Anthology中EMNLP会议2016年至2018年的已接受论文摘要。数据集中的摘要信息从arXiv中提取,如适用。数据由acl-anthology...
    packageimg
  • Reddit科技与科学领域缩略词数据集

    2025年4月15日   

    Reddit科技与科学领域缩略词数据集 数据来源:互联网公开数据 标签:缩略词,科技,科学,Reddit,社交媒体,文本分析,数据挖掘,自然语言处理 数据概述:...
    packageimg