找到11,761个数据集

标签: 自然语言处理

过滤结果
  • 光学字符识别OCRCSV数据集CSVOCRDataset-hhhoang

    2025年4月25日   

    光学字符识别OCRCSV数据集CSVOCRDataset-hhhoang 数据来源:互联网公开数据 标签:光学字符识别,数据集,文本识别,机器学习,数据挖掘,计算机视觉,自然语言处理,数字化 数据概述:该数据集包含来自多个来源的光学字符识别(OCR)任务数据,记录了从图像中提取的文本信息及其对应的CSV格式标签。主要特征如下:...
    packageimg
  • 招聘场景最佳简历筛选数据集ResumeDatasettoFindBestResumes-vishaljiodedra

    2025年4月25日   

    招聘场景最佳简历筛选数据集ResumeDatasettoFindBestResumes-vishaljiodedra 数据来源:互联网公开数据 标签:简历筛选,招聘,数据集,机器学习,人力资源,人才管理,自然语言处理,数据分析 数据概述: 该数据集包含来自多个企业的简历数据,记录了求职者的信息,适用于简历筛选和最佳简历挑选等任务。主要特征如下:...
    packageimg
  • 电影评论情感分析数据集IMDBReviewsDataset-gulsendemir

    2025年4月25日   

    电影评论情感分析数据集IMDBReviewsDataset-gulsendemir 数据来源:互联网公开数据 标签:情感分析,电影评论,数据集,自然语言处理,机器学习,文本分类,数据挖掘,人工智能 数据概述:该数据集包含来自IMDB(互联网电影数据库)的电影评论数据,记录了大量用户对电影的评价和情感倾向。主要特征如下:...
    packageimg
  • 乌尔都语语言文本数据集Urdu-LanguageDataset-tabarkarajab

    2025年4月25日   

    乌尔都语语言文本数据集Urdu-LanguageDataset-tabarkarajab 数据来源:互联网公开数据 标签:语言处理,文本分析,自然语言处理,乌尔都语,机器学习,数据集,文本分类,多语言 数据概述: 该数据集包含来自互联网公开资源的乌尔都语文本数据,记录了乌尔都语的自然语言文本内容。主要特征如下:...
    packageimg
  • GPT-2模型微调数据集GPT-2Fine-tuneDataset-sahib12

    2025年4月25日   

    GPT-2模型微调数据集GPT-2Fine-tuneDataset-sahib12 数据来源:互联网公开数据 标签:自然语言处理,数据集,机器学习,语言模型,文本生成,深度学习,人工智能,模型微调 数据概述: 该数据集包含用于微调GPT-2语言模型的数据,主要记录了文本数据及其相关的标注信息。主要特征如下:...
    packageimg
  • 自然语言处理入门数据集IntroductiontoNLPDataset-iheb404notfound

    2025年4月25日   

    自然语言处理入门数据集IntroductiontoNLPDataset-iheb404notfound 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分析,机器学习,人工智能,语言模型,文本分类,情感分析 数据概述: 该数据集用于自然语言处理的入门学习和研究,记录了多种文本数据及相应的标注信息。主要特征如下:...
    packageimg
  • 僧伽罗语文本情感分析数据集SinhalaTextSentimentAnalysisDataset-dalinaranga

    2025年4月25日   

    僧伽罗语文本情感分析数据集SinhalaTextSentimentAnalysisDataset-dalinaranga 数据来源:互联网公开数据 标签:情感分析,文本挖掘,僧伽罗语,自然语言处理,数据集,机器学习,语言学,舆情分析 数据概述: 该数据集包含了僧伽罗语文本数据,用于情感分析任务。主要特征如下:...
    packageimg
  • 越南维基百科抄袭检测数据集VietnameseWikipediaPlagiarismDetectionDataset-dungg1810

    2025年4月25日   

    越南维基百科抄袭检测数据集VietnameseWikipediaPlagiarismDetectionDataset-dungg1810 数据来源:互联网公开数据 标签:数据集,抄袭检测,文本分析,自然语言处理,机器学习,学术诚信,信息检索,越南语 数据概述: 该数据集包含来自越南维基百科的文本数据,记录了用于抄袭检测的文本样本。主要特征如下:...
    packageimg
  • ChatGPT用户评论数据集ChatGPTUserReviewDataset-aswanikrishnav

    2025年4月25日   

    ChatGPT用户评论数据集ChatGPTUserReviewDataset-aswanikrishnav 数据来源:互联网公开数据 标签:自然语言处理,用户评论,数据集,文本分析,情感分析,机器学习,人工智能,产品反馈 数据概述: 该数据集包含来自ChatGPT用户的评论数据,记录了用户对ChatGPT产品的使用体验和反馈。主要特征如下:...
    packageimg
  • 药品标签信息数据集DrugLabelInformationDataset-aminemharzi

    2025年4月25日   

    药品标签信息数据集DrugLabelInformationDataset-aminemharzi 数据来源:互联网公开数据 标签:医药健康,药品标签,数据集,文本分析,自然语言处理,医疗信息,数据挖掘,机器学习 数据概述: 该数据集包含来自药品标签的信息,记录了各类药品的标签数据。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。...
    packageimg
  • 科莱里奥斯伪标签V2数据集ColeridgePseudoLabelsV2Dataset-chienhsianghung

    2025年4月25日   

    科莱里奥斯伪标签V2数据集ColeridgePseudoLabelsV2Dataset-chienhsianghung 数据来源:互联网公开数据 标签:自然语言处理,数据集,伪标签,机器学习,文本分类,学术论文,数据增强,智能分析 数据概述:...
    packageimg
  • 新闻内容发布与传播数据集DelfiCleanedNewsContentandDistributionDataset-janphiliptpfer

    2025年4月25日   

    新闻内容发布与传播数据集DelfiCleanedNewsContentandDistributionDataset-janphiliptpfer 数据来源:互联网公开数据 标签:新闻分析,内容传播,数据集,媒体研究,自然语言处理,机器学习,信息传播,社会研究 数据概述:...
    packageimg
  • 简历命名实体识别数据集ResumeNERDataset-raj26000

    2025年4月25日   

    简历命名实体识别数据集ResumeNERDataset-raj26000 数据来源:互联网公开数据 标签:简历处理,命名实体识别,数据集,自然语言处理,文本分析,机器学习,人力资源,人才招聘 数据概述:该数据集包含来自多个来源的简历数据,主要用于命名实体识别任务,记录了简历中的关键信息。主要特征如下:...
    packageimg
  • Sibert情感分析数据集-thnhanvng

    2025年4月25日   

    Sibert情感分析数据集-thnhanvng 数据来源:互联网公开数据 标签:情感分析,数据集,文本分析,自然语言处理,NLP,情感分类,情绪识别,机器学习,社交媒体 数据概述: 该数据集包含了Sibert提供的用于情感分析的文本数据,记录了各种文本片段的情感倾向。主要特征如下: 时间跨度:数据记录的时间跨度不明确,主要关注文本内容的情感表达。...
    packageimg
  • 网络欺凌数据集Tanglish网络欺凌数据集唐语版本-mrchamp

    2025年4月25日   

    网络欺凌数据集Tanglish网络欺凌数据集唐语版本-mrchamp 数据来源:互联网公开数据 标签:网络欺凌,数据集,社交媒体,文本分析,自然语言处理,机器学习,社会学,心理学 数据概述:该数据集由Tanglish项目提供,主要记录了社交媒体平台上的文本数据,用于研究和识别网络欺凌行为。主要特征如下:...
    packageimg
  • 方言数据集DialectDataDataset-kitashinwtf

    2025年4月25日   

    方言数据集DialectDataDataset-kitashinwtf 数据来源:互联网公开数据 标签:方言,语言学,数据集,语音识别,机器学习,自然语言处理,语言研究,文化研究 数据概述: 该数据集包含来自不同地区方言的语音和文本数据,记录了多种方言的发音,词汇和语法特征。主要特征如下: 时间跨度:数据记录的时间范围从近年到现代。...
    packageimg
  • 自然语言处理新闻标题数据集ANLPHeadlinesDataset-divyessh01

    2025年4月25日   

    自然语言处理新闻标题数据集ANLPHeadlinesDataset-divyessh01 数据来源:互联网公开数据 标签:自然语言处理,新闻标题,文本分析,机器学习,情感分析,文本摘要,数据集,语言模型 数据概述: 该数据集包含来自多个新闻来源的新闻标题数据,主要用于自然语言处理(NLP)相关的研究和应用。主要特征如下:...
    packageimg
  • 中文维基百科词向量模型训练数据集-文本语料-2023年

    2025年4月25日   

    中文维基百科词向量模型训练数据集-文本语料-2023年 数据来源:互联网公开数据 标签:自然语言处理, 词向量, word2vec, 文本语料, 中文, 维基百科, 机器学习, 深度学习, 训练数据 数据概述:...
    packageimg
  • 推特情感分析预处理数据集TwitterSentimentAnalysisPreprocessedDataset-nileshthonte

    2025年4月25日   

    推特情感分析预处理数据集TwitterSentimentAnalysisPreprocessedDataset-nileshthonte 数据来源:互联网公开数据 标签:情感分析,数据集,社交媒体,自然语言处理,机器学习,文本挖掘,情感计算,数据预处理 数据概述: 该数据集包含来自推特平台的用户文本数据,经过预处理用于情感分析任务。主要特征如下:...
    packageimg
  • Reddit社交媒体情感分析数据集RedditSentimentAnalysisDataset-chibuzokelechi

    2025年4月25日   

    Reddit社交媒体情感分析数据集RedditSentimentAnalysisDataset-chibuzokelechi 数据来源:互联网公开数据 标签:情感分析,社交媒体,数据集,自然语言处理,机器学习,文本挖掘,数据科学,社会科学 数据概述: 该数据集包含来自Reddit社交媒体平台的数据,记录了用户发布的内容及其对应的情感标签。主要特征如下:...
    packageimg