找到11,679个数据集

标签: 自然语言处理

过滤结果
  • 英语词汇综合列表数据集

    2025年4月15日   

    英语词汇综合列表数据集 数据来源:互联网公开数据 标签:英语词汇,自然语言处理,NLP,语言学,词汇库 数据概述: 本数据集包含超过416,000个独特的英语单词,涵盖了广泛的主题和领域,是一个全面的英语词汇列表。该数据集适用于多种自然语言处理任务、语言学研究和其他需要大量英语词汇的应用场景。 数据用途概述:...
    packageimg
  • 福尔摩斯的矛盾增强数据集1963-2021

    2025年4月15日   

    福尔摩斯的矛盾增强数据集1963-2021 数据来源:互联网公开数据 标签:自然语言处理,数据增强,矛盾检测,机器翻译,同义词替换,测试集增强,文本分析 数据概述:...
    packageimg
  • LG电子员工评价数据集

    2025年4月15日   

    LG电子员工评价数据集 数据来源:互联网公开数据 标签:LG电子,员工评价,工作环境,职场体验,数据分析,情感分析,自然语言处理 数据概述: LG电子员工评价数据集汇集了来自Ambition Box平台上员工对LG电子的评价和意见,Ambition...
    packageimg
  • 问答平台问题点赞数预测数据集

    2025年4月15日   

    问答平台问题点赞数预测数据集 数据来源:互联网公开数据 标签:问答平台,用户行为分析,点赞预测,机器学习,自然语言处理,声誉,用户互动,数据挖掘 数据概述:...
    packageimg
  • 全战斗词汇数据集

    2025年4月15日   

    全战斗词汇数据集 数据来源:互联网公开数据 标签:儿童写作,青年写作,创意写作,故事创作,自然语言处理,性别语言模式,创造力培养 数据概述:...
    packageimg
  • 英语语法错误纠正常用数据集

    2025年4月15日   

    英语语法错误纠正常用数据集 数据来源:互联网公开数据 标签:语法错误,英语学习,自然语言处理,语法纠正,机器学习,文本分析 数据概述: 本数据集是JFLEG(JHU FLuency-Extended...
    packageimg
  • Eminem专辑YouTube评论垃圾邮件分类数据集

    2025年4月15日   

    Eminem专辑YouTube评论垃圾邮件分类数据集 数据来源:互联网公开数据 标签:Eminem, YouTube, 评论, 垃圾邮件, 自然语言处理, 机器学习, 文本分类, 社交媒体分析 数据概述: 本数据集由Ezhil...
    packageimg
  • 尼泊尔健康问答语料库

    2025年4月15日   

    尼泊尔健康问答语料库 数据来源:互联网公开数据 标签:尼泊尔,健康,问答,文化影响,机器学习,自然语言处理,公共卫生,心理健康 数据概述:...
    packageimg
  • Anthropic公司Claude模型生成的1000篇论文数据集-说服性写作练习-多主题-时间跨度未知

    2025年4月15日   

    Anthropic公司Claude模型生成的1000篇论文数据集-说服性写作练习-多主题-时间跨度未知 数据来源:互联网公开数据 标签:人工智能,自然语言处理,文本生成,写作,Claude模型,说服性写作,论文,Anthropic 数据概述: 本数据集包含了由Anthropic公司开发的Claude-...
    packageimg
  • 推特语言行为数据集

    2025年4月15日   

    推特语言行为数据集 数据来源:互联网公开数据 标签:推特,语言行为,沟通分析,文本分类,社交网络分析,自然语言处理,社交媒体研究 数据概述:...
    packageimg
  • 英国英语语音识别数据集1963-2021

    2025年4月15日   

    英国英语语音识别数据集1963-2021 数据来源:互联网公开数据 标签:英国英语,语音识别,自然语言处理,对话系统,语言理解,音频数据,文本转录,演讲者信息,多样话题 数据概述:...
    packageimg
  • 医学影像报告结构化数据集

    2025年4月15日   

    医学影像报告结构化数据集 数据来源:互联网公开数据 标签:医学影像,结构化报告,自然语言处理,深度学习,Transformer,医学信息提取,腹盆腔超声报告 数据概述:...
    packageimg
  • Reddit平台政治观点讨论分析数据集-自由派与保守派-13000条帖子

    2025年4月15日   

    Reddit平台政治观点讨论分析数据集-自由派与保守派-13000条帖子 数据来源:互联网公开数据 标签:Reddit,政治,观点分析,自由派,保守派,文本数据,社交媒体,NLP,自然语言处理 数据概述:...
    packageimg
  • 推特用户情感分析数据集-社交媒体互动与情感洞察-2023年

    2025年4月15日   

    推特用户情感分析数据集-社交媒体互动与情感洞察-2023年 数据来源:互联网公开数据 标签:推特,情感分析,社交媒体,文本挖掘,自然语言处理,用户行为,情感倾向,舆情分析 数据概述:...
    packageimg
  • 多语言大型语言模型生成文本数据集1963-2021

    2025年4月15日   

    多语言大型语言模型生成文本数据集1963-2021 数据来源:互联网公开数据 标签:大型语言模型,多语言,文本生成,机器学习,自然语言处理,人工智能,深度学习,神经网络,数据科学,文本分类,语言理解,文本挖掘 数据概述:...
    packageimg
  • 尼泊尔语社交媒体情感分析数据集

    2025年4月15日   

    尼泊尔语社交媒体情感分析数据集 数据来源:互联网公开数据 标签:情感分析,自然语言处理,尼泊尔语,社交媒体,文本分类,情感,NLP,机器学习 数据概述: 本数据集包含尼泊尔语社交媒体文本,并标注了情感极性。情感标签分为三类:积极(1),消极(0),和中性(2)。数据集来源于Hugging Face Datasets...
    packageimg
  • 社交媒体情感分析数据集-用户评论情感分类-训练与评估-公开

    2025年4月15日   

    社交媒体情感分析数据集-用户评论情感分类-训练与评估-公开 数据来源:互联网公开数据 标签:情感分析,自然语言处理,社交媒体,用户评论,文本分类,机器学习,情感分类,正负中性 数据概述: 本数据集旨在支持社交媒体情感分析任务,涵盖了用户评论的情感倾向分类。数据集包含训练集、开发集和测试集,用于模型的训练、验证和评估。...
    packageimg
  • 多语言医学问答数据集MedQA-4K数据集

    2025年4月15日   

    多语言医学问答数据集MedQA-4K数据集 数据来源:互联网公开数据 标签:医学,问答,多语言,自然语言处理,机器学习,英语,中文,韩语,医疗,数据集 数据概述: 本数据集源于MedQA数据集,并精心挑选了多选题形式的医学问题。该数据集专为多语言自然语言处理和微调语言模型而设计。 关键特征: 语言分布:...
    packageimg
  • 斯里兰卡麻醉药品法问答数据集

    2025年4月15日   

    斯里兰卡麻醉药品法问答数据集 数据来源:互联网公开数据 标签:斯里兰卡,麻醉药品法,问答数据集,法律文本分析,自然语言处理,法律信息抽取 数据概述:...
    packageimg
  • LLM提示恢复数据集800个提示

    2025年4月15日   

    LLM提示恢复数据集800个提示 数据来源:互联网公开数据 标签:LLM,提示恢复,自然语言处理,机器学习,竞赛数据,文本生成,人工智能 数据概述: 本数据集为LLM提示恢复竞赛而创建,包含了800个精心设计的语言模型提示。这些提示涵盖了多种应用场景和主题,旨在用于评估和改进语言模型的提示恢复能力。数据集中的每个提示都经过仔细设计,确保多样性和代表性。...
    packageimg