找到12,017个数据集

标签: 自然语言处理

过滤结果
  • EEDI预训练混合数据集EEDIEmbedPretrainMixFinalDataset-conjuring92

    2025年4月26日   

    EEDI预训练混合数据集EEDIEmbedPretrainMixFinalDataset-conjuring92 数据来源:互联网公开数据 标签:自然语言处理,预训练,数据集,文本嵌入,深度学习,语言模型,机器翻译,文本生成 数据概述: 该数据集是EEDI项目用于预训练的最终混合数据集,包含了多种来源的文本数据,旨在提升语言模型的性能。主要特征如下:...
    packageimg
  • 土耳其科技新闻2022数据集TurkishTechnologyNews2022Dataset-denizhanahin

    2025年4月26日   

    土耳其科技新闻2022数据集TurkishTechnologyNews2022Dataset-denizhanahin 数据来源:互联网公开数据 标签:科技新闻,数据集,文本分析,自然语言处理,机器学习,信息提取,土耳其,新闻报道...
    packageimg
  • 披头士乐队歌词数据集TheBeatlesLyricsDataset-yeonseokcho

    2025年4月26日   

    披头士乐队歌词数据集TheBeatlesLyricsDataset-yeonseokcho 数据来源:互联网公开数据 标签:流行音乐,歌词分析,数据集,音乐研究,文本挖掘,自然语言处理,音乐历史,文化研究 数据概述: 该数据集包含来自披头士乐队(The...
    packageimg
  • 立陶宛金融新闻文本数据集LithuanianFinancialNewsTextDataset-rokastrimaitis

    2025年4月26日   

    立陶宛金融新闻文本数据集LithuanianFinancialNewsTextDataset-rokastrimaitis 数据来源:互联网公开数据 标签:金融新闻,文本分析,自然语言处理,立陶宛,数据集,情感分析,信息抽取,语言模型 数据概述: 该数据集包含了来自立陶宛金融新闻的文本数据,旨在用于金融领域相关的文本分析任务。主要特征如下: 时间跨度:...
    packageimg
  • 健康App评论数据集HealthAppsReviewDataset-faysal1998

    2025年4月26日   

    健康App评论数据集HealthAppsReviewDataset-faysal1998 数据来源:互联网公开数据 标签:健康App,评论,用户评价,自然语言处理,情感分析,移动健康,机器学习,App Store 数据概述: 该数据集包含来自App Store的健康App评论数据,记录了用户对不同健康类App的评价。主要特征如下:...
    packageimg
  • 中文维基百科词向量与关系抽取数据集ZWRSDataset-BigDataAnalysisforPyTorch-william2777

    2025年4月26日   

    中文维基百科词向量与关系抽取数据集ZWRSDataset-BigDataAnalysisforPyTorch-william2777 数据来源:互联网公开数据 标签:自然语言处理,词向量,关系抽取,数据集,PyTorch,深度学习,中文,大数据分析 数据概述:...
    packageimg
  • 印度政治剧帕塔尔洛克IMDB评论数据集PaatalLokIMDBReviewDataset-souren

    2025年4月26日   

    印度政治剧帕塔尔洛克IMDB评论数据集PaatalLokIMDBReviewDataset-souren 数据来源:互联网公开数据 标签:影视评论,数据集,情感分析,机器学习,文本挖掘,自然语言处理,印度电影,数据分析 数据概述: 该数据集包含来自IMDB网站的用户对印度政治剧《帕塔尔洛克》的评论数据,记录了观众对剧集的评价和反馈。主要特征如下:...
    packageimg
  • 样本问答数据集SampledQADataDataset-hritik619916

    2025年4月26日   

    样本问答数据集SampledQADataDataset-hritik619916 数据来源:互联网公开数据 标签:问答系统,数据集,自然语言处理,机器学习,信息检索,文本分析,人工智能,数据挖掘 数据概述: 该数据集包含来自公开来源的问答对样本数据,记录了问题与对应答案的配对信息。主要特征如下:...
    packageimg
  • AI对齐领域人机交互质量评估数据集-HelpSteer

    2025年4月26日   

    AI对齐领域人机交互质量评估数据集-HelpSteer 数据来源:互联网公开数据 标签:AI对齐,人机交互,自然语言处理,数据集,Prompt,响应,评价,可信赖AI,机器学习 数据概述:...
    packageimg
  • GermEval18文本分类数据集-thedevastator

    2025年4月22日   

    GermEval18文本分类数据集-thedevastator 数据来源:互联网公开数据 标签:文本分类,情感分析,主题分类,二元分类,多类分类,自然语言处理,机器学习 数据概述:...
    packageimg
  • 西班牙语推特数据集SpanishTweetsDataset-furqanamjad

    2025年4月26日   

    西班牙语推特数据集SpanishTweetsDataset-furqanamjad 数据来源:互联网公开数据 标签:社交媒体,文本分析,情感分析,机器学习,自然语言处理,数据集,语言研究,舆情分析 数据概述: 该数据集包含来自Twitter平台的西班牙语推文数据,记录了用户发布的内容及其相关属性。主要特征如下:...
    packageimg
  • 语音识别与转录数据集KS0709V-01WhisperOutsDataset-liumail511

    2025年4月26日   

    语音识别与转录数据集KS0709V-01WhisperOutsDataset-liumail511 数据来源:互联网公开数据 标签:语音识别,数据集,转录,人工智能,自然语言处理,机器学习,语音技术,数据科学 数据概述: 该数据集包含来自KS0709V-01项目的语音识别与转录数据,记录了不同场景下的语音内容及其对应的文本转录。主要特征如下:...
    packageimg
  • 句子情感分析数据集AspectSentenceCSVDataset-costleyosaro

    2025年4月26日   

    句子情感分析数据集AspectSentenceCSVDataset-costleyosaro 数据来源:互联网公开数据 标签:情感分析,文本挖掘,自然语言处理,数据集,评论分析,机器学习,情感分类,中文文本 数据概述: 该数据集包含来自用户评论的句子数据,旨在用于情感分析任务。主要特征如下:...
    packageimg
  • 多语言翻译应用性能评估数据集

    2025年4月26日   

    多语言翻译应用性能评估数据集 数据来源:互联网公开数据 标签:翻译应用,多语言支持,翻译质量,用户评价,性能评估,自然语言处理,机器学习 数据概述:...
    packageimg
  • 情感分析测试数据集ABSATestDataset-ndycuongnguyen

    2025年4月26日   

    情感分析测试数据集ABSATestDataset-ndycuongnguyen 数据来源:互联网公开数据 标签:情感分析,文本挖掘,自然语言处理,数据集,机器学习,情感分类,评论分析,ABSA 数据概述:该数据集包含用于情感分析(ABSA, Aspect-Based Sentiment...
    packageimg
  • 情感分析数据集SentimentDetection-ganeshsamarth

    2025年4月26日   

    情感分析数据集SentimentDetection-ganeshsamarth 数据来源:互联网公开数据 标签:情感分析,文本挖掘,自然语言处理,机器学习,情感分类,数据集,文本情感,情绪识别 数据概述: 该数据集包含用于情感分析的文本数据,记录了各种文本内容的情感倾向。主要特征如下: 时间跨度:数据记录的时间跨度不固定,涵盖了不同时间段的文本数据。...
    packageimg
  • 亚马逊商品评论数据集AmazonProductReviewsDataset-sovannayak11

    2025年4月26日   

    亚马逊商品评论数据集AmazonProductReviewsDataset-sovannayak11 数据来源:互联网公开数据 标签:电子商务,商品评论,数据集,文本分析,情感分析,机器学习,消费者行为,自然语言处理 数据概述: 该数据集包含来自亚马逊网站的商品评论数据,记录了消费者对不同商品的评分和评论内容。主要特征如下:...
    packageimg
  • 股票评论情感分析数据集-longnguyenchi

    2025年4月26日   

    股票评论情感分析数据集-longnguyenchi 数据来源:互联网公开数据 标签:股票,评论,情感分析,自然语言处理,文本挖掘,金融,机器学习,市场情绪 数据概述: 该数据集包含来自互联网的股票评论数据,记录了用户对股票的评论内容及其对应的情感极性。主要特征如下: 时间跨度:数据记录的时间范围为不确定,取决于数据来源的时间跨度。...
    packageimg
  • 海湾地区方言数据集GulfDialectsDataset-afifaalawami

    2025年4月26日   

    海湾地区方言数据集GulfDialectsDataset-afifaalawami 数据来源:互联网公开数据 标签:方言研究,语音识别,自然语言处理,中东语言,文本分析,机器学习,文化研究,语言学 数据概述:该数据集包含来自海湾地区(包括沙特阿拉伯,阿联酋,科威特,卡塔尔,巴林和也门)的方言数据,记录了不同地区方言的语音和文本样本。主要特征如下:...
    packageimg
  • 泰迪问答系统多语言数据集BengaliandTeluguVersion数据集泰迪QABengali-TeluguDataset-nbroad

    2025年4月26日   

    泰迪问答系统多语言数据集BengaliandTeluguVersion数据集泰迪QABengali-TeluguDataset-nbroad 数据来源:互联网公开数据 标签:泰迪QA,多语言问答,数据集,自然语言处理,机器学习,文本分类,语言理解,计算机辅助翻译 数据概述: 该数据集包含来自泰迪QA(TYDI...
    packageimg