找到11,697个数据集

标签: 自然语言处理

过滤结果
  • 问答驱动阅读理解研究数据集2011-2013

    2025年4月14日   

    问答驱动阅读理解研究数据集2011-2013 数据来源:互联网公开数据 标签:问答系统,阅读理解,自然语言处理,研究数据集,阿尔茨海默病,入学考试 数据概述: 问答驱动阅读理解(QA4MRE)数据集是由Huggingface Hub提供的一个庞大问答数据集,包含多个主题的文档及对应的问答对。该数据集作为CLEF...
    packageimg
  • 写作质量挑战构造性文章数据集

    2025年4月14日   

    写作质量挑战构造性文章数据集 数据来源:互联网公开数据 标签:写作质量,过程建模,机器学习竞赛,自然语言处理,特征工程,教育评估 数据概述: 本数据集基于“将写作过程与写作质量联系起来”竞赛的训练日志构建,包含通过代码生成的构造性文章数据。构造性文章的生成基于两个版本的代码实现:Version 02 和 Version...
    packageimg
  • 疾病百科数据集

    2025年4月14日   

    疾病百科数据集 数据来源:互联网公开数据 标签:疾病,医学,诊断,治疗,西班牙语,自然语言处理,机器学习,训练数据,健康信息 数据概述: 本数据集包含了来自西班牙语维基百科(Wikipedia...
    packageimg
  • 阿拉伯语方言数据集

    2025年4月14日   

    阿拉伯语方言数据集 数据来源:互联网公开数据 标签:阿拉伯语方言,社交媒体文本,文本分类,语言分析,自然语言处理,区域语言差异 数据概述: 本数据集来源于Twitter平台,包含38,394条记录,主要分为四类阿拉伯语方言,分别为埃及方言、海湾方言、约旦方言和也门方言。各类别数据分布不均衡,为研究人员提供了多样化的数据资源。 数据用途概述:...
    packageimg
  • 苹果发布会演讲记录数据集

    2025年4月14日   

    苹果发布会演讲记录数据集 数据来源:互联网公开数据 标签:苹果公司,发布会,演讲记录,自然语言处理,内容分析,文本挖掘,行业趋势 数据概述:...
    packageimg
  • 新冠疫情相似句对判定数据集

    2025年4月14日   

    新冠疫情相似句对判定数据集 数据来源:互联网公开数据 标签:新冠疫情,相似句对,文本分析,自然语言处理,疫情信息,语义分析 数据概述:...
    packageimg
  • 大型语言模型训练问答数据集1963-2021

    2025年4月14日   

    大型语言模型训练问答数据集1963-2021 数据来源:互联网公开数据 标签:大型语言模型,问答系统,多语言,文本生成,机器学习,训练数据,自然语言处理 数据概述:...
    packageimg
  • 自然语言处理研究论文数据集

    2025年4月14日   

    自然语言处理研究论文数据集 数据来源:互联网公开数据 标签:自然语言处理,研究论文,文本摘要,文档分类,结构分析,文本总结,学术研究 数据概述:...
    packageimg
  • 语言分类数据集

    2025年4月14日   

    语言分类数据集 数据来源:互联网公开数据 标签:语言分类,多语言数据集,机器学习,深度学习,自然语言处理,句法分析 数据概述:...
    packageimg
  • 技能与职位描述语料库数据集

    2025年4月14日   

    技能与职位描述语料库数据集 数据来源:互联网公开数据 标签:技能,职位描述,自然语言处理,技能提取,机器学习,语料库,技能分析 数据概述: 本数据集基于大量职位描述数据构建,经过多轮数据清洗、格式标准化和预处理,最终形成了一套结构化、高质量的技能语料库。数据集包含了与技能相关的文本信息,适用于技能提取、技能分类、技能推荐等场景。 数据用途概述:...
    packageimg
  • LLM科学考试竞赛数据集-SciQ数据集

    2025年4月14日   

    LLM科学考试竞赛数据集-SciQ数据集 数据来源:互联网公开数据 标签:科学,考试,LLM,自然语言处理,人工智能,竞赛,问答,教育,机器学习 数据概述: 本数据集是Allen...
    packageimg
  • 推特情绪强度分析数据集1963-2021

    2025年4月14日   

    推特情绪强度分析数据集1963-2021 数据来源:互联网公开数据 标签:情绪分析,推特,情感强度,情绪分类,自然语言处理,文本分析,社交媒体分析 数据概述:...
    packageimg
  • 美国酒店评论数据分析数据集2023

    2025年4月14日   

    美国酒店评论数据分析数据集2023 数据来源:互联网公开数据 标签:酒店,评论,数据分析,美国,州级比较,情感分析,自然语言处理 数据概述:...
    packageimg
  • 文档评论意图分类数据集

    2025年4月14日   

    文档评论意图分类数据集 数据来源:互联网公开数据 标签:文档评论,意图分类,CommonCrawl,文本分析,自然语言处理,商务文档,交互分析 数据概述:...
    packageimg
  • 土耳其学术期刊机器学习与人工智能论文摘要数据集-DergiPark网站-v2

    2025年4月14日   

    土耳其学术期刊机器学习与人工智能论文摘要数据集-DergiPark网站-v2 数据来源:互联网公开数据 标签:机器学习,深度学习,迁移学习,人工智能,论文摘要,土耳其,学术期刊,自然语言处理,文本分析 数据概述:...
    packageimg
  • 数据99K数据集带上下文版本2

    2025年4月14日   

    数据99K数据集带上下文版本2 数据来源:互联网公开数据 标签:文本数据,上下文,自然语言处理,机器学习,数据标注 数据概述: 本数据集包含99,000条带上下文的文本数据,旨在为自然语言处理和机器学习任务提供丰富的训练素材。数据集中的每一条记录都包含一个句子及其上下文信息,有助于模型更好地理解和生成连贯的文本。 数据用途概述:...
    packageimg
  • 奥斯卡颁奖典礼获奖感言文本数据集-1940至今

    2025年4月14日   

    奥斯卡颁奖典礼获奖感言文本数据集-1940至今 数据来源:互联网公开数据 标签:奥斯卡,颁奖典礼,获奖感言,电影,文本分析,情感分析,自然语言处理,文化研究 数据概述:...
    packageimg
  • 巴佳电气员工评价数据集

    2025年4月14日   

    巴佳电气员工评价数据集 数据来源:互联网公开数据 标签:巴佳电气,员工评价,工作环境,员工体验,职场文化,情感分析,自然语言处理,数据分析 数据概述: 本数据集汇集了巴佳电气员工在Ambition Box平台上分享的宝贵见解和评价,Ambition...
    packageimg
  • 印度尼西亚论文错误检测数据集2023

    2025年4月14日   

    印度尼西亚论文错误检测数据集2023 数据来源:互联网公开数据 标签:论文错误检测,印度尼西亚,文本处理,自然语言处理,机器学习,数据增强,学术研究 数据概述: 本数据集来源于PERSUADE 2.0数据集,并经过Claude...
    packageimg
  • 社交媒体仇恨言论识别数据集-文本内容-2017

    2025年4月14日   

    社交媒体仇恨言论识别数据集-文本内容-2017 数据来源:互联网公开数据 标签:仇恨言论,社交媒体,文本分析,情感分析,自然语言处理,语言学,数据标注,分类,攻击性语言 数据概述: 本数据集包含近1.5万条短文本,每条文本均由多位贡献者进行标注,以识别其是否包含仇恨言论。标注结果分为三类:a) 包含仇恨言论;b) 具有攻击性,但不属于仇恨言论;c)...
    packageimg