找到11,768个数据集

标签: 自然语言处理

过滤结果
  • YouTube评论阿塞拜疆数据集YouTubeCommentsAzerbaijanDataset-farhadzeynalli

    2025年4月25日   

    YouTube评论阿塞拜疆数据集YouTubeCommentsAzerbaijanDataset-farhadzeynalli 数据来源:互联网公开数据 标签:YouTube,评论,数据集,社交媒体,自然语言处理,情感分析,跨文化研究,阿塞拜疆...
    packageimg
  • Quora重复问题数据集QuoraDuplicateQuestionsDataset-gyanbardhan

    2025年4月25日   

    Quora重复问题数据集QuoraDuplicateQuestionsDataset-gyanbardhan 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,机器学习,问答系统,信息检索,数据挖掘,人工智能 数据概述: 该数据集源自Quora平台,记录了平台上用户提出的重复问题及其相关信息。主要特征如下:...
    packageimg
  • 问答系统Python微调数据集Question-AnswerPythonLoraFine-tuningDataset-ashish32700

    2025年4月25日   

    问答系统Python微调数据集Question-AnswerPythonLoraFine-tuningDataset-ashish32700 数据来源:互联网公开数据 标签:问答系统,Python,微调,数据集,自然语言处理,机器学习,深度学习,人工智能 数据概述:...
    packageimg
  • 自然语言处理作业2-3数据集NLPAssignment2-3Dataset-dheerajkr1a1a

    2025年4月25日   

    自然语言处理作业2-3数据集NLPAssignment2-3Dataset-dheerajkr1a1a 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分析,机器学习,情感分析,语言模型,学术资源,文本分类 数据概述: 该数据集来自自然语言处理课程作业2-3,记录了用于文本分类和情感分析任务的文本数据。主要特征如下:...
    packageimg
  • 大型语言模型总结能力评估数据集CivilSum-PHIDataset-veerchheda

    2025年4月25日   

    大型语言模型总结能力评估数据集CivilSum-PHIDataset-veerchheda 数据来源:互联网公开数据 标签:文本摘要,自然语言处理,大型语言模型,评估数据集,模型测评,文本生成,人工智能,学术研究 数据概述: 该数据集包含用于评估大型语言模型(LLM)总结能力的文本数据。主要特征如下: 时间跨度:数据收集时间跨度不限,持续更新。...
    packageimg
  • 推特灾难事件文本数据集PreprocessedDisasterTweetsDataset-priyanagda

    2025年4月25日   

    推特灾难事件文本数据集PreprocessedDisasterTweetsDataset-priyanagda 数据来源:互联网公开数据 标签:推特,灾难事件,文本分析,自然语言处理,机器学习,情感分析,数据挖掘,社会科学 数据概述: 该数据集包含来自推特平台的公开数据,记录了与灾难事件相关的推文信息。主要特征如下:...
    packageimg
  • 多领域数据集Multi-domainDataset-amanrajput27

    2025年4月25日   

    多领域数据集Multi-domainDataset-amanrajput27 数据来源:互联网公开数据 标签:多领域,数据集,文本分类,自然语言处理,机器学习,情感分析,主题建模,信息检索 数据概述: 该数据集整合了来自多个领域和主题的文本数据,旨在为多领域文本分析和机器学习任务提供支持。主要特征如下:...
    packageimg
  • 用户评论情感分析数据集DevotionReviewsDataset-j457zhan

    2025年4月25日   

    用户评论情感分析数据集DevotionReviewsDataset-j457zhan 数据来源:互联网公开数据 标签:情感分析,用户评论,数据集,自然语言处理,文本挖掘,机器学习,数据分析,商业智能 数据概述: 该数据集包含来自互联网平台的用户评论数据,记录了用户对不同产品或服务的评价内容。主要特征如下: 时间跨度:...
    packageimg
  • 二分类文本识别数据集BinaryTextClassificationDataset-soumyasangamjha

    2025年4月25日   

    二分类文本识别数据集BinaryTextClassificationDataset-soumyasangamjha 数据来源:互联网公开数据 标签:文本分类,数据集,机器学习,自然语言处理,情感分析,算法模型,数据挖掘,人工智能 数据概述: 该数据集包含来自互联网公开来源的二分类文本数据,主要用于文本分类任务。主要特征如下:...
    packageimg
  • 自然语言处理朴素贝叶斯分类器项目NLPNaiveBayesClassifierProject-todorvalev

    2025年4月25日   

    自然语言处理朴素贝叶斯分类器项目NLPNaiveBayesClassifierProject-todorvalev 数据来源:互联网公开数据 标签:自然语言处理,朴素贝叶斯,数据集,文本分类,机器学习,分类算法,数据挖掘,人工智能 数据概述: 该数据集来源于自然语言处理朴素贝叶斯分类器项目,记录了用于文本分类任务的文本数据。主要特征如下:...
    packageimg
  • 自由声音音频标签数据集FreesoundAudioTaggingDataset-ruthberenstein

    2025年4月25日   

    自由声音音频标签数据集FreesoundAudioTaggingDataset-ruthberenstein 数据来源:互联网公开数据 标签:音频数据,数据集,声音识别,机器学习,音频处理,自然语言处理,声音分类,声学分析 数据概述:...
    packageimg
  • 布尔问答数据集BoolQDataset-parthplc

    2025年4月25日   

    布尔问答数据集BoolQDataset-parthplc 数据来源:互联网公开数据 标签:布尔问答,自然语言处理,数据集,机器学习,文本分类,逻辑推理,人工智能,计算机科学 数据概述: 该数据集由斯坦福大学提供,主要记录了布尔问答的文本数据,适用于自然语言处理和逻辑推理研究。主要特征如下: 时间跨度:数据记录的时间范围从2019年到2020年。...
    packageimg
  • TED演讲内容数据集TEDTalksMainCSVDataset-nafisaalianika

    2025年4月25日   

    TED演讲内容数据集TEDTalksMainCSVDataset-nafisaalianika 数据来源:互联网公开数据 标签:TED演讲,数据集,文本分析,语言学习,机器学习,自然语言处理,教育,心理学 数据概述: 该数据集包含来自TED官网的主要演讲内容数据,记录了 TED 演讲的详细信息和文本内容。主要特征如下:...
    packageimg
  • 新闻文本分类数据集-oussemahedri

    2025年4月25日   

    新闻文本分类数据集-oussemahedri 数据来源:互联网公开数据 标签:新闻,文本分类,自然语言处理,机器学习,文本分析,数据集,新闻报道,中文 数据概述:该数据集包含来自互联网新闻网站的新闻文本数据,记录了不同类别新闻的详细信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2023年。...
    packageimg
  • 语音识别与自适应技术数据集AISHELLAdaptationDataset-hohohacn

    2025年4月25日   

    语音识别与自适应技术数据集AISHELLAdaptationDataset-hohohacn 数据来源:互联网公开数据 标签:语音识别,自适应技术,数据集,自然语言处理,人工智能,机器学习,语音信号处理,教育技术 数据概述: 该数据集由AISHELL项目提供,专注于语音识别和自适应技术的应用。主要特征如下:...
    packageimg
  • 语音识别-中文语音情感识别数据集Voice-CS-ChineseSpeechEmotionRecognitionDataset-saivamsiganta

    2025年4月25日   

    语音识别-中文语音情感识别数据集Voice-CS-ChineseSpeechEmotionRecognitionDataset-saivamsiganta 数据来源:互联网公开数据 标签:语音识别,情感识别,数据集,中文,深度学习,自然语言处理,音频分析,机器学习 数据概述:...
    packageimg
  • 气胸MIMIC报告数据集PneumothoraxMIMICReportsDataset-wasifnafee

    2025年4月25日   

    气胸MIMIC报告数据集PneumothoraxMIMICReportsDataset-wasifnafee 数据来源:互联网公开数据 标签:医疗影像,气胸,MIMIC数据库,数据集,医学报告,深度学习,自然语言处理,临床研究 数据概述:...
    packageimg
  • 粤语YouTube评论数据集YouTubeCommentsinCantoneseDataset-bitit1994

    2025年4月25日   

    粤语YouTube评论数据集YouTubeCommentsinCantoneseDataset-bitit1994 数据来源:互联网公开数据 标签:社交媒体,评论分析,自然语言处理,数据集,粤语,情感分析,机器学习,文本挖掘 数据概述: 该数据集包含来自YouTube平台的粤语评论数据,记录了用户对视频内容的评论信息。主要特征如下:...
    packageimg
  • 楚瓦什语维基百科平行语料库数据集Chuvash-WikiParallelCorpusDataset-kvzhirnov

    2025年4月25日   

    楚瓦什语维基百科平行语料库数据集Chuvash-WikiParallelCorpusDataset-kvzhirnov 数据来源:互联网公开数据 标签:语言资源,平行语料库,自然语言处理,机器翻译,楚瓦什语,维基百科,多语言数据,文本分析 数据概述:...
    packageimg
  • 语言模型与人工智能生成数据集LLMAI-GeneratedDataset-jeremiahobeng

    2025年4月25日   

    语言模型与人工智能生成数据集LLMAI-GeneratedDataset-jeremiahobeng 数据来源:互联网公开数据 标签:人工智能,语言模型,数据生成,自然语言处理,机器学习,数据集,文本分析,智能生成 数据概述: 该数据集包含由语言模型和人工智能技术生成的文本数据,记录了通过先进AI模型生成的各种类型文本内容。主要特征如下:...
    packageimg