找到11,973个数据集

标签: 自然语言处理

过滤结果
  • 德语到英语机器翻译数据集

    2025年4月15日   

    德语到英语机器翻译数据集 数据来源:互联网公开数据 标签:机器翻译,德语,英语,数据集,PyTorch,自然语言处理,翻译模型 数据概述: 本数据集包含用于机器翻译的德语到英语句子对,旨在为翻译模型的训练和评估提供数据支持。数据集由28975条训练数据和1000条测试数据组成,涵盖了多样化的语言表达和上下文。 数据用途概述:...
    packageimg
  • 宾夕法尼亚大学语料库初步版本数据集

    2025年4月15日   

    宾夕法尼亚大学语料库初步版本数据集 数据来源:互联网公开数据 标签:宾夕法尼亚大学,语料库,自然语言处理,文本分析,语言学 数据概述: 本数据集是宾夕法尼亚大学语料库的初步版本,涵盖了一系列标注的英语文本,适用于自然语言处理和语言学研究。该语料库包含了精心标注的句子结构、词性、依存关系等信息,为研究人员提供了丰富的语言学数据资源。 数据用途概述:...
    packageimg
  • 客户互动分析数据集-跨渠道用户行为与情感研究2015-2023

    2025年4月15日   

    客户互动分析数据集-跨渠道用户行为与情感研究2015-2023 数据来源:互联网公开数据 标签:客户互动,跨渠道分析,情感分析,用户行为,商业智能,自然语言处理 数据概述:...
    packageimg
  • 科学考试评估额外样本数据集

    2025年4月15日   

    科学考试评估额外样本数据集 数据来源:互联网公开数据 标签:科学考试,模型评估,自然语言处理,机器学习,数据集扩展,问题解答,评分标准 数据概述: 本数据集包含500个额外的科学考试相关样本,每个样本均包含问题描述、参考答案、评分标准及模型输出结果。数据内容覆盖物理学、化学、生物学等多个科学领域,适用于评估自然语言处理模型在科学考试场景下的表现。...
    packageimg
  • 德古拉与傲慢与偏见文本分类数据集

    2025年4月15日   

    德古拉与傲慢与偏见文本分类数据集 数据来源:互联网公开数据 标签:文本分类,自然语言处理,NLP,文学作品,情感分析,语料库,句子级别 数据概述: 本数据集包含《德古拉》(Dracula)和《傲慢与偏见》(Pride and...
    packageimg
  • 圣经与古兰经情感分析数据集

    2025年4月15日   

    圣经与古兰经情感分析数据集 数据来源:互联网公开数据 标签:圣经,古兰经,情感分析,文本分析,自然语言处理,NLP,宗教文本,情感词典,情感极性,词频统计,词云 数据概述: 本数据集包含了《圣经》(King James Version,...
    packageimg
  • 高质量文本摘要与生成示例数据集

    2025年4月15日   

    高质量文本摘要与生成示例数据集 数据来源:互联网公开数据 标签:文本摘要,生成模型,自然语言处理,NLP,数据训练,模型优化,高质量示例 数据概述: 本数据集包含15,000个高质量的文本摘要与生成示例,由GPT-3.5...
    packageimg
  • 数据10000条独特医疗推文数据集

    2025年4月15日   

    数据10000条独特医疗推文数据集 数据来源:互联网公开数据 标签:医疗推文,糖尿病,癌症,心理健康,自然语言处理,NLP,机器学习,情感分析 数据概述:...
    packageimg
  • WikiQA开放域问答数据集-问题与句子对-开放域问答研究

    2025年4月15日   

    WikiQA开放域问答数据集-问题与句子对-开放域问答研究 数据来源:互联网公开数据 标签:问答系统,自然语言处理,文本匹配,信息检索,知识库,开放域问答,WikiQA,机器学习,数据集 数据概述:...
    packageimg
  • 星际编码器自指令数据集-自然语言处理指令生成-2024

    2025年4月15日   

    星际编码器自指令数据集-自然语言处理指令生成-2024 数据来源:互联网公开数据 标签:自然语言处理,指令生成,语言模型,机器学习,数据集,星际编码器,Stanford Alpaca,CC0 数据概述:...
    packageimg
  • 图卢字母数据集

    2025年4月15日   

    图卢字母数据集 数据来源:互联网公开数据 标签:图卢字母,自然语言处理,字符识别,图像分类,卷积神经网络,机器学习,文化保护 数据概述:...
    packageimg
  • 印尼语评论情感分析数据集SERFEE

    2025年4月15日   

    印尼语评论情感分析数据集SERFEE 数据来源:互联网公开数据 标签:情感分析,印尼语,文本数据,机器学习,自然语言处理,评论,情感分类 数据概述: 本数据集专为印尼语情感分析任务设计,通过整合“indonlu”和“google-play-...
    packageimg
  • 孟加拉语同义句识别基准语料库数据集

    2025年4月15日   

    孟加拉语同义句识别基准语料库数据集 数据来源:互联网公开数据 标签:同义句检测,孟加拉语,语料库,自然语言处理,文本分析,机器学习,语言模型评估 数据概述: 本数据集是一个用于孟加拉语同义句识别的基准语料库,收录了8,787对人工标注的句子对,这些句子对来源于23家报纸头版在四个类别中的内容。该数据集旨在为孟加拉语同义句检测的研究提供全面的基准。...
    packageimg
  • 生成式AI推特数据集10K

    2025年4月15日   

    生成式AI推特数据集10K 数据来源:互联网公开数据 标签:生成式AI,推特数据,自然语言处理,情感分析,语言模型,ChatGPT,Google Bard,多样化内容,现实对话 数据概述: 本数据集收录了超过10,000条由高级语言模型(包括ChatGPT和Google...
    packageimg
  • 数据科学与软件开发趋势数据集

    2025年4月15日   

    数据科学与软件开发趋势数据集 数据来源:互联网公开数据 标签:数据科学,软件开发,趋势分析,博客文章,自然语言处理,机器学习,内容策略 数据概述:...
    packageimg
  • IMDB电影数据集2006-2016

    2025年4月15日   

    IMDB电影数据集2006-2016 数据来源:互联网公开数据 标签:IMDB,电影数据,票房,影评,电影分析,导演,演员,票房趋势,电影推荐,自然语言处理 数据概述:...
    packageimg
  • DatabricksDolly15k-基于指令的大型语言模型训练数据集

    2025年4月15日   

    DatabricksDolly15k-基于指令的大型语言模型训练数据集 数据来源:互联网公开数据 标签:大型语言模型,指令遵循,数据增强,自然语言处理,文本生成,分类,问答,摘要,信息提取,创意写作,开源数据集 数据概述: Databricks Dolly...
    packageimg
  • 自然故事语料库数据集1963-2021

    2025年4月15日   

    自然故事语料库数据集1963-2021 数据来源:互联网公开数据 标签:自然语言处理,阅读时间,语料库,低频语法构型,心理学,语言学 数据概述:...
    packageimg
  • 在线评论扩展原始数据集

    2025年4月15日   

    在线评论扩展原始数据集 数据来源:互联网公开数据 标签:在线评论,电子商务,商品评价,俄语文本,数据清洗,自然语言处理 数据概述:...
    packageimg
  • 越南餐饮评论情感分析数据集1963-2021

    2025年4月15日   

    越南餐饮评论情感分析数据集1963-2021 数据来源:互联网公开数据 标签:越南,餐饮评论,情感分析,机器学习,自然语言处理,文本分类,特征提取,推荐系统,跨语言分析 数据概述: 本数据集是两个现有数据集的整合和精选集合,即Taaaan和Vu Duc Thinh编写的《越南情感分析-Foody》以及Cฦฐฦกง Khuแบฅต...
    packageimg