找到11,730个数据集

标签: 自然语言处理

过滤结果
  • 性别检测数据集GenderDetectionDataset-subhajournal

    2025年4月23日   

    性别检测数据集GenderDetectionDataset-subhajournal 数据来源:互联网公开数据 标签:性别检测,数据集,自然语言处理,机器学习,文本分析,文本分类,社会研究,信息提取 数据概述:该数据集包含来自互联网的公开数据,记录了不同用户在社交媒体上的用户名,昵称和相关文本信息,适用于性别检测和分类任务。主要特征如下:...
    packageimg
  • 韩语仇恨言论数据集

    2025年4月23日   

    韩语仇恨言论数据集 数据来源:互联网公开数据 标签:韩语,仇恨言论,文本分类,自然语言处理,社会分析,多分类模型,二分类模型 数据概述: 本数据集包含韩语仇恨言论文本数据,由从韩国右翼网站“일간베스트”爬取的仇恨和歧视性评论组成。数据集分为两部分: 1. hate-speech-binary-...
    packageimg
  • 自然语言处理微调与优化数据集Fine-tuningDatasetforNLPOptimization-inductiveanks

    2025年4月23日   

    自然语言处理微调与优化数据集Fine-tuningDatasetforNLPOptimization-inductiveanks 数据来源:互联网公开数据 标签:自然语言处理,微调,文本分类,数据集,机器学习,深度学习,语言模型,模型优化...
    packageimg
  • edX在线课程文本数据数据集-shtrausslearning

    2025年4月23日   

    edX在线课程文本数据数据集-shtrausslearning 数据来源:互联网公开数据 标签:教育,文本数据,在线课程,自然语言处理,机器学习,情感分析,学习行为,课程评估 数据概述: 该数据集包含来自edX在线学习平台的课程文本数据,记录了课程的各种文本信息。主要特征如下: 时间跨度:数据记录的时间跨度为不确定,取决于edX平台课程的发布时间。...
    packageimg
  • 亚马逊手机产品评论与评分数据集AmazonPhoneProductReviewsandRatingDataset-codewithuday

    2025年4月23日   

    亚马逊手机产品评论与评分数据集AmazonPhoneProductReviewsandRatingDataset-codewithuday 数据来源:互联网公开数据 标签:亚马逊,手机,产品评论,评分,情感分析,自然语言处理,机器学习,消费者行为 数据概述:...
    packageimg
  • 葡萄牙语文本分类数据集PortugueseTextClassificationDataset-rookiejing

    2025年4月23日   

    葡萄牙语文本分类数据集PortugueseTextClassificationDataset-rookiejing 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,语言模型,机器学习,多语言,文本分析,语言学 数据概述: 该数据集包含来自葡萄牙语互联网的文本数据,专门用于葡萄牙语的文本分类任务。主要特征如下:...
    packageimg
  • 新闻数据集NewsDataOneDataset-sammyke

    2025年4月23日   

    新闻数据集NewsDataOneDataset-sammyke 数据来源:互联网公开数据 标签:新闻,数据集,文本分析,信息检索,自然语言处理,机器学习,数据挖掘,新闻媒体 数据概述: 该数据集包含来自多个新闻媒体平台的数据,记录了各类新闻文章的详细信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。...
    packageimg
  • 阿尔及利亚方言医学问答数据集-2022-boulesnane

    2025年4月23日   

    阿尔及利亚方言医学问答数据集-2022-boulesnane 数据来源:互联网公开数据 标签:阿尔及利亚,阿拉伯语,医学问答,对话机器人,Seq2Seq,健康咨询,自然语言处理 数据概述:...
    packageimg
  • 推特文本情感分析数据集UpdatedTwitterDatasets-ayeshakhaliqned

    2025年4月23日   

    推特文本情感分析数据集UpdatedTwitterDatasets-ayeshakhaliqned 数据来源:互联网公开数据 标签:社交媒体,情感分析,推特,文本数据,自然语言处理,机器学习,情感分类,舆情分析 数据概述: 该数据集包含来自推特(Twitter)的文本数据,主要用于情感分析任务。主要特征如下:...
    packageimg
  • 深入洞察ChatGPT用户评论数据集助力提升AI交互体验

    2025年4月23日   

    标题:深入洞察ChatGPT用户评论数据集助力提升AI交互体验 数据内容: 该数据集包含了ChatGPT用户的评论信息,具体数据元素包括: 1. Review Id:评论的唯一标识符,共有193,154个不同的值,表明数据集覆盖了大量独立评论。 2. Review:用户的评论内容,共有125,492个不同的值,反映了用户对ChatGPT的多样化反馈。...
    packageimg
  • 对话系统研究与应用数据集TailsDialogueDataset-averium515

    2025年4月23日   

    对话系统研究与应用数据集TailsDialogueDataset-averium515 数据来源:互联网公开数据 标签:对话系统,自然语言处理,数据集,机器学习,人机交互,语音识别,智能助手,人工智能 数据概述: 该数据集包含来自TAILS项目的对话数据,记录了不同场景下的对话交互内容。主要特征如下:...
    packageimg
  • Reddit金融新闻标题数据集RedditFinanceHeadlinesDataset-vantran1510

    2025年4月23日   

    Reddit金融新闻标题数据集RedditFinanceHeadlinesDataset-vantran1510 数据来源:互联网公开数据 标签:金融新闻,数据集,自然语言处理,文本分析,机器学习,情感分析,新闻标题,数据分析 数据概述: 该数据集包含来自Reddit平台的金融新闻标题数据,记录了金融领域的新闻标题及其相关信息。主要特征如下:...
    packageimg
  • 词频统计数据集WordFrequenciesDataset-patricknormile

    2025年4月23日   

    词频统计数据集WordFrequenciesDataset-patricknormile 数据来源:互联网公开数据 标签:文本分析,词频统计,自然语言处理,数据集,数据挖掘,语言学,机器学习,文本预处理 数据概述: 该数据集包含来自多个文本来源的词频统计数据,记录了不同语料库中单词出现的频率。主要特征如下:...
    packageimg
  • 新闻标题拼写错误数据集100万条

    2025年4月23日   

    新闻标题拼写错误数据集100万条 数据来源:互联网公开数据 标签:拼写错误,新闻标题,自然语言处理,数据生成,拼写校正模型,机器学习,文本处理 数据概述: 本数据集包含通过nlpaug库生成的100万条新闻标题的拼写错误数据。这些标题原本应为正确拼写,但经过处理引入了不同类型的拼写错误,为构建和评估拼写校正模型提供了丰富的训练和测试材料。...
    packageimg
  • 韩国自然语言推理数据集1963-2021-thedevastator

    2025年4月23日   

    韩国自然语言推理数据集1963-2021-thedevastator 数据来源:互联网公开数据 标签:KOR_NLI,自然语言推理,韩语,文本分析,机器学习,自然语言处理,推理模型 数据概述:...
    packageimg
  • 电影剧情概述与类型关联分析数据集-hetpatel01

    2025年4月23日   

    电影剧情概述与类型关联分析数据集-hetpatel01 数据来源:互联网公开数据 标签:电影,类型,剧情,文本分析,自然语言处理,NLP,文本分类,推荐系统,多标签分类 数据概述:...
    packageimg
  • 缅甸医学微生物学问答数据集-2023-minsithu

    2025年4月23日   

    缅甸医学微生物学问答数据集-2023-minsithu 数据来源:互联网公开数据 标签:医学,微生物学,问答数据,缅甸语,自然语言处理,机器学习,教育资源 数据概述:...
    packageimg
  • 抑郁症识别与心理健康分析数据集DepressionDetectionfromRedditDataset-deapdaru

    2025年4月23日   

    抑郁症识别与心理健康分析数据集DepressionDetectionfromRedditDataset-deapdaru 数据来源:互联网公开数据 标签:心理健康,抑郁症,数据集,社交网络,文本分析,机器学习,情感识别,自然语言处理 数据概述:...
    packageimg
  • 多语言自然语言推理数据集MultilingualNLPInferenceDataset-sanjusrivatsa9

    2025年4月23日   

    多语言自然语言推理数据集MultilingualNLPInferenceDataset-sanjusrivatsa9 数据来源:互联网公开数据 标签:自然语言处理,多语言,推理,数据集,机器学习,深度学习,人工智能,文本分析 数据概述: 该数据集包含来自多个来源的多语言文本数据,专门用于自然语言推理任务。主要特征如下: 时间跨度:...
    packageimg
  • 用户评论情感分析数据集UHackSentiments20Dataset-biswajitroy7890

    2025年4月23日   

    用户评论情感分析数据集UHackSentiments20Dataset-biswajitroy7890 数据来源:互联网公开数据 标签:情感分析,自然语言处理,文本挖掘,数据集,机器学习,用户评论,情感分类,社交媒体 数据概述: 该数据集来源于UHack竞赛,主要包含用户评论文本及其对应的情感标签,用于情感分析任务。主要特征如下:...
    packageimg