找到11,697个数据集

标签: 自然语言处理

过滤结果
  • 越南语问答匹配数据集VietnameseQuestionAnsweringMatchingDataset-ictworld

    2025年5月28日   

    越南语问答匹配数据集VietnameseQuestionAnsweringMatchingDataset-ictworld 数据来源:互联网公开数据 标签:问答匹配, 自然语言处理, 文本相似度, 文本分类, 越南语, 语义理解, 知识检索, 机器阅读理解 数据概述:...
    packageimg
  • 开放印度理工学院学术数据集OpenIITAcademicData-shaunakmajumdar

    2025年5月28日   

    开放印度理工学院学术数据集OpenIITAcademicData-shaunakmajumdar 数据来源:互联网公开数据 标签:学术研究,数据集,教育技术,机器学习,自然语言处理,印度理工学院,开放数据,计算机科学 数据概述: 该数据集包含来自印度理工学院的开放学术数据,记录了学术领域的文本和对话信息。主要特征如下:...
    packageimg
  • AI文本检测模型训练数据集AIDetectDistilBERT-lonnieqin

    2025年5月28日   

    AI文本检测模型训练数据集AIDetectDistilBERT-lonnieqin 数据来源:互联网公开数据 标签:文本检测,数据集,自然语言处理,机器学习,DistilBERT,AI检测,文本分析,内容识别 数据概述: 该数据集包含用于训练和评估AI文本检测模型的数据,旨在识别文本是否由人工智能生成。主要特征如下:...
    packageimg
  • 文本摘要评估语句数据集TextSummarizationEvaluationSentences-terrychanorg

    2025年5月28日   

    文本摘要评估语句数据集TextSummarizationEvaluationSentences-terrychanorg 数据来源:互联网公开数据 标签:文本摘要, 自然语言处理, 语句评估, 文本分析, 语篇理解, 机器翻译, 情感分析, 语料库 数据概述:...
    packageimg
  • 印尼商业新闻分类数据集CategorizedIndonesianBusinessNewsDataset-cakrulgaming

    2025年5月28日   

    印尼商业新闻分类数据集CategorizedIndonesianBusinessNewsDataset-cakrulgaming 数据来源:互联网公开数据 标签:商业新闻,印尼,文本分类,自然语言处理,数据集,新闻分析,机器学习,经济 数据概述: 该数据集包含了来自印尼新闻媒体的商业新闻文章,旨在用于文本分类和分析。主要特征如下:...
    packageimg
  • 新闻事件情感分析数据集NewsEventSentimentAnalysis-tikadisplay

    2025年5月28日   

    新闻事件情感分析数据集NewsEventSentimentAnalysis-tikadisplay 数据来源:互联网公开数据 标签:情感分析, 自然语言处理, 新闻文本, 文本分类, 情感标注, 机器学习, 数据集, 媒体分析 数据概述: 该数据集包含来自新闻媒体的文章摘要,记录了不同新闻事件的文本内容,旨在用于情感分析任务。主要特征如下:...
    packageimg
  • 文本摘要生成俄语新闻数据集TextSummarizationRussianNewsDataset-nmaria

    2025年5月28日   

    文本摘要生成俄语新闻数据集TextSummarizationRussianNewsDataset-nmaria 数据来源:互联网公开数据 标签:文本摘要, 俄语, 新闻, 自然语言处理, 机器翻译, 深度学习, 数据集, 文本生成 数据概述: 该数据集包含来自新闻媒体的俄语新闻文本及其对应的摘要,旨在用于训练和评估文本摘要模型。主要特征如下:...
    packageimg
  • 越南语自然语言处理NLP数据集-minhhieuhuynh

    2025年5月28日   

    越南语自然语言处理NLP数据集-minhhieuhuynh 数据来源:互联网公开数据 标签:自然语言处理,越南语,文本分析,机器翻译,情感分析,数据集,语言模型,文本挖掘 数据概述: 该数据集包含来自越南语文本的数据,用于自然语言处理任务。主要特征如下: 时间跨度:数据记录的时间跨度不定,取决于具体子数据集,可能涵盖多年。...
    packageimg
  • 捐赠者选择基金会捐款项目数据集DonorsChoose-orgDonationProjectsDataset-atifimam

    2025年5月28日   

    捐赠者选择基金会捐款项目数据集DonorsChoose-orgDonationProjectsDataset-atifimam 数据来源:互联网公开数据 标签:捐款,教育,数据集,自然语言处理,机器学习,文本分析,慈善事业,项目资助 数据概述: 该数据集包含来自捐赠者选择基金会 (DonorsChoose.org)...
    packageimg
  • 维基百科表格问题数据集WikiTableQuestionsDataset-kegiazabal001

    2025年5月28日   

    维基百科表格问题数据集WikiTableQuestionsDataset-kegiazabal001 数据来源:互联网公开数据 标签:自然语言处理,问答系统,数据集,表格理解,语义分析,知识图谱,机器学习,文本挖掘 数据概述: 该数据集包含来自维基百科的表格和基于这些表格提出的问题,旨在用于训练和评估问答系统在结构化数据上的表现。主要特征如下:...
    packageimg
  • 电影评论情感分析数据集MovieReviewSentimentAnalysis-shahedhamed

    2025年5月28日   

    电影评论情感分析数据集MovieReviewSentimentAnalysis-shahedhamed 数据来源:互联网公开数据 标签:情感分析, 文本分类, 自然语言处理, 机器学习, 电影评论, 情感极性, 数据集, 深度学习 数据概述: 该数据集包含来自电影评论网站的文本数据,记录了用户对电影的评论及其对应的情感极性标签。主要特征如下:...
    packageimg
  • 印度英语阅读理解数据集Chaii-ImplDataset-ktgiahieu

    2025年5月28日   

    印度英语阅读理解数据集Chaii-ImplDataset-ktgiahieu 数据来源:互联网公开数据 标签:阅读理解,自然语言处理,数据集,英语学习,机器学习,文本分析,印度文化,问答系统 数据概述: 该数据集包含来自Chaii项目的印度英语阅读理解数据,旨在评估和促进对印度英语文本的理解能力。主要特征如下:...
    packageimg
  • GitHub问题追踪数据集MH-GitHubBugDataset-saurabh502

    2025年5月28日   

    GitHub问题追踪数据集MH-GitHubBugDataset-saurabh502 数据来源:互联网公开数据 标签:软件工程,缺陷检测,数据集,自然语言处理,文本分析,机器学习,代码分析,开源项目 数据概述: 该数据集包含来自GitHub的软件缺陷报告数据,记录了软件开发过程中遇到的问题和错误。主要特征如下:...
    packageimg
  • 学生写作内容与用词评估数据集StudentWritingContentandWordingEvaluationDataset-syhens

    2025年5月28日   

    学生写作内容与用词评估数据集StudentWritingContentandWordingEvaluationDataset-syhens 数据来源:互联网公开数据 标签:学生写作, 内容评估, 用词评估, 自然语言处理, 文本分析, 机器学习, 情感分析, 教育 数据概述:...
    packageimg
  • 招聘信息文本分析数据集JobInformationTextAnalysis-sophiatu2

    2025年5月28日   

    招聘信息文本分析数据集JobInformationTextAnalysis-sophiatu2 数据来源:互联网公开数据 标签:招聘信息, 文本分析, 自然语言处理, 职业描述, 职位匹配, 数据清洗, 机器学习, 行业分析 数据概述:...
    packageimg
  • 新闻语料库训练集NFCorpus相关与不相关文档数据集-manupande21111997

    2025年5月28日   

    新闻语料库训练集NFCorpus相关与不相关文档数据集-manupande21111997 数据来源:互联网公开数据 标签:新闻语料库,文本分类,信息检索,数据集,自然语言处理,机器学习,文本分析,相关性判断 数据概述: 该数据集包含来自新闻语料库(NF Corpus)的训练数据,记录了新闻文章及其与特定查询词的相关性判断。主要特征如下:...
    packageimg
  • 人工智能开放智能模型元数据数据集OpenAIMetadataDataset-reallavatus

    2025年5月28日   

    人工智能开放智能模型元数据数据集OpenAIMetadataDataset-reallavatus 数据来源:互联网公开数据 标签:人工智能,元数据,数据集,机器学习,模型训练,自然语言处理,智能模型,技术资源 数据概述: 该数据集包含来自人工智能开放智能模型的相关元数据信息,记录了模型的详细信息。主要特征如下:...
    packageimg
  • 英语新闻文本分析数据集EnglishNewsTextAnalysisDataset-directioner

    2025年5月28日   

    英语新闻文本分析数据集EnglishNewsTextAnalysisDataset-directioner 数据来源:互联网公开数据 标签:新闻,文本分析,数据集,自然语言处理,机器学习,语料库,数据挖掘,信息提取 数据概述: 该数据集包含来自各大新闻媒体和新闻聚合平台的英语新闻文本,记录了不同主题和类型的新闻报道。主要特征如下:...
    packageimg
  • 美食推荐系统数据集Food-comRecSysDataset-iamnotwhale

    2025年5月28日   

    美食推荐系统数据集Food-comRecSysDataset-iamnotwhale 数据来源:互联网公开数据 标签:美食,推荐系统,用户行为,数据集,自然语言处理,机器学习,菜谱,食谱推荐 数据概述: 该数据集包含了来自Food.com的美食数据,主要用于构建和评估推荐系统。主要特征如下:...
    packageimg
  • 新闻摘要生成文本数据集NewsSummarizationTextDataset-vansy08

    2025年5月28日   

    新闻摘要生成文本数据集NewsSummarizationTextDataset-vansy08 数据来源:互联网公开数据 标签:文本摘要, 自然语言处理, 新闻分析, 文本生成, 深度学习, 机器翻译, 语料库, 数据集 数据概述: 该数据集包含来自新闻网站的文章及其对应的摘要,用于训练和评估文本摘要模型。主要特征如下:...
    packageimg