找到557个数据集

标签: NLP

过滤结果
  • 维基百科主题与类别数据集

    2025年6月1日 30 38 24

    维基百科主题与类别数据集 数据来源:互联网公开数据 标签:维基百科,主题标签,类别分类,NLP,文本分析,数据挖掘,知识图谱,元数据,语义分析 数据概述: 本数据集基于维基百科页面标题及其分类信息,包含超过2300万个主题及其相关类别。每个主题(如“Anarchism”)都附带丰富的元数据,包括所属类别(如“Political...
    packageimg
  • 纽约时报烹饪食谱评论互动数据集-2021年5月至6月-michaelruddy

    2025年6月1日 30 134 18

    纽约时报烹饪食谱评论互动数据集-2021年5月至6月-michaelruddy 数据来源:互联网公开数据 标签:食谱评论,纽约时报,烹饪,用户互动,评论分析,NLP,自然语言处理,食谱,社交媒体,情感分析 数据概述: 本数据集收录了2021年5月至6月期间,纽约时报烹饪(NYT...
    packageimg
  • 移动应用商店应用描述文本分析数据集-sagol79

    2025年6月1日 30 8 7

    移动应用商店应用描述文本分析数据集-sagol79 数据来源:互联网公开数据 标签:移动应用,应用描述,文本分析,自然语言处理,机器学习,应用商店,文本挖掘,NLP,应用分类 数据概述:...
    packageimg
  • 文本与摘要配对数据集-2023-tanay654321

    2025年6月1日 30 56 14

    文本与摘要配对数据集-2023-tanay654321 数据来源:互联网公开数据 标签:文本摘要,自然语言处理,机器学习,编码器解码器,NLP,数据集 数据概述: 本数据集包含2列,一列为原始文本,另一列为对应的摘要。数据集共有318,710行记录,适用于文本摘要生成任务的研究与开发。该数据集可以从Kaggle平台下载,与之配套的代码文件名为“TEXT...
    packageimg
  • 雅虎问答10类别NLP数据集

    2025年6月1日 30 84 39

    雅虎问答10类别NLP数据集 数据来源:互联网公开数据 标签:问答分类,自然语言处理,NLP,文本分类,问答系统,文本分析,机器学习,主题分类 数据概述:...
    packageimg
  • 俄罗斯国家杜马演讲数据集

    2025年6月1日 30 29 13

    俄罗斯国家杜马演讲数据集 数据来源:互联网公开数据 标签:俄罗斯政治,国家杜马,政策分析,时间序列,情感分析,NLP,政治文本,政府决策 数据概述:...
    packageimg
  • ACL多标签分类审查元数据集1963-2021-divyanshukunwar

    2025年6月1日 30 44 32

    ACL多标签分类审查元数据集1963-2021-divyanshukunwar 数据来源:互联网公开数据 标签:ACL,多标签分类,文本生成,审查数据,结构控制,自然语言处理,NLP,机器学习,学术出版 数据概述: 本数据集MReD(Meta-Review...
    packageimg
  • 乌尔都语新闻文本大规模数据集-2021-saurabhshahane

    2025年6月1日 30 92 91

    乌尔都语新闻文本大规模数据集-2021-saurabhshahane 数据来源:互联网公开数据 标签:乌尔都语,新闻数据,文本处理,NLP,分类,摘要,命名实体识别,主题建模,文本生成 数据概述:...
    packageimg
  • 梵文关系数据集

    2025年6月1日 30 116 40

    梵文关系数据集 数据来源:互联网公开数据 标签:梵文,句法分析,语料库,关系数据,NLP,语言学研究,文本分析 数据概述: 本数据集基于CoNLL-U格式文件构建,将原始的结构化文本数据转换为关系型数据格式,并存储为 Feather 文件以提高数据处理的效率和灵活性。数据集包含两个主要文件:words.feather 和...
    packageimg
  • 谷歌竞赛自然语言处理模型特征数据集-2021

    2025年6月1日 30 104 85

    谷歌竞赛自然语言处理模型特征数据集-2021 数据来源:互联网公开数据 标签:谷歌竞赛,NLP,自然语言处理,特征向量,模型配置,数据集,Parquet,CSV 数据概述: 本数据集包含用于谷歌竞赛的自然语言处理(NLP)模型的各种特征和配置信息。数据集组织成多个文件夹,每个文件夹代表不同的NLP模型配置和特征。具体包括:...
    packageimg
  • 数据2020至2023年俄罗斯新闻分类竞赛数据集-vorvit

    2025年6月1日 30 50 4

    2020至2023年俄罗斯新闻分类竞赛数据集-vorvit 数据来源:互联网公开数据 标签:新闻,分类,机器学习,自然语言处理,NLP,竞赛,ВШЭ,ВШЭ Магистратура,First Step in NLP 数据概述:...
    packageimg
  • 通用大型语言模型预训练文本与元数据数据集-ThePileSmall-thedevastator

    2025年6月1日 30 136 36

    通用大型语言模型预训练文本与元数据数据集-ThePileSmall-thedevastator 数据来源:互联网公开数据 标签:文本数据,元数据,自然语言处理,预训练,机器学习,情感分析,文本摘要,数据集,NLP 数据概述: 本数据集“The Pile...
    packageimg
  • 机器学习与医疗健康专利数据分析数据集-2023-karnikakapoor

    2025年6月1日 30 155 15

    机器学习与医疗健康专利数据分析数据集-2023-karnikakapoor 数据来源:互联网公开数据 标签:机器学习,医疗健康,专利数据,NLP,技术分析,技术创新,数据挖掘 数据概述: 本数据集是一份全面的专利记录集合,涵盖了机器学习与医疗健康创新领域的专利。数据集通过在Google Patents上使用“Machine Learning and...
    packageimg
  • 说服力分析数据集-2-0版本-deepaksingh47

    2025年6月1日 30 89 19

    说服力分析数据集-2-0版本-deepaksingh47 数据来源:互联网公开数据 标签:说服力,数据集,自然语言处理,NLP,教育,自动化评分,写作分析 数据概述: 本数据集包含两个主要部分:persuade_corpus_2.0 和 persuade_corpus_1.0。这两个数据集均来源于指定的公开数据源。此外,我们还新增了一个文件...
    packageimg
  • 人工智能与人类文本区分数据集

    2025年6月1日 30 168 132

    人工智能与人类文本区分数据集 数据来源:互联网公开数据 标签:人工智能,文本分类,文本转换,自然语言处理,NLP,数据分类,文本生成,文本质量评估 数据概述:...
    packageimg
  • 亚马逊电子产品用户评价情感分析数据集-2018年

    2025年6月1日 30 144 66

    亚马逊电子产品用户评价情感分析数据集-2018年 数据来源:互联网公开数据 标签:亚马逊,电子产品,用户评价,情感分析,文本挖掘,评分,评论,NLP,自然语言处理 数据概述:...
    packageimg
  • 多语言句子嵌入模型DistilUSE-base-multilingual-cased-v2数据集

    2025年6月1日 30 76 16

    多语言句子嵌入模型DistilUSE-base-multilingual-cased-v2数据集 数据来源:互联网公开数据 标签:句子嵌入,多语言,自然语言处理,NLP,机器学习,文本相似度,语义分析,UKPLab 数据概述: 本数据集包含多语言句子嵌入模型DistilUSE-base-multilingual-...
    packageimg
  • 维基百科句子拆分数据集-2023-thedevastator

    2025年5月31日 30 164 41

    维基百科句子拆分数据集-2023-thedevastator 数据来源:互联网公开数据 标签:维基百科,句子拆分,NLP,自然语言处理,文本分析,数据集,机器学习 数据概述:...
    packageimg
  • 凤凰城YELP餐饮评价数据集-2021-tanjaadzic

    2025年5月31日 30 24 8

    凤凰城YELP餐饮评价数据集-2021-tanjaadzic 数据来源:互联网公开数据 标签:YELP,餐饮评价,消费者反馈,数据分析,NLP,教育,Phoenix,AZ,大数据 数据概述:...
    packageimg
  • 巴西新闻文章文本数据集-新闻内容分析-2024

    2025年5月31日 30 60 26

    巴西新闻文章文本数据集-新闻内容分析-2024 数据来源:互联网公开数据 标签:巴西,新闻,文本,自然语言处理,NLP,金融,信息提取,时事,政治,经济,社会 数据概述: 本数据集包含来自巴西联邦数字图书馆的新闻文章文本,旨在为自然语言处理(NLP)模型构建提供可靠且一致的数据源。数据集涵盖了各种主题的新闻报道,为研究人员提供了丰富的文本数据。...
    packageimg