-
EEDI预训练混合数据集EEDIEmbedPretrainMixFinalDataset-conjuring92
EEDI预训练混合数据集EEDIEmbedPretrainMixFinalDataset-conjuring92 数据来源:互联网公开数据 标签:自然语言处理,预训练,数据集,文本嵌入,深度学习,语言模型,机器翻译,文本生成 数据概述: 该数据集是EEDI项目用于预训练的最终混合数据集,包含了多种来源的文本数据,旨在提升语言模型的性能。主要特征如下:... -
土耳其科技新闻2022数据集TurkishTechnologyNews2022Dataset-denizhanahin
土耳其科技新闻2022数据集TurkishTechnologyNews2022Dataset-denizhanahin 数据来源:互联网公开数据 标签:科技新闻,数据集,文本分析,自然语言处理,机器学习,信息提取,土耳其,新闻报道... -
披头士乐队歌词数据集TheBeatlesLyricsDataset-yeonseokcho
披头士乐队歌词数据集TheBeatlesLyricsDataset-yeonseokcho 数据来源:互联网公开数据 标签:流行音乐,歌词分析,数据集,音乐研究,文本挖掘,自然语言处理,音乐历史,文化研究 数据概述: 该数据集包含来自披头士乐队(The... -
立陶宛金融新闻文本数据集LithuanianFinancialNewsTextDataset-rokastrimaitis
立陶宛金融新闻文本数据集LithuanianFinancialNewsTextDataset-rokastrimaitis 数据来源:互联网公开数据 标签:金融新闻,文本分析,自然语言处理,立陶宛,数据集,情感分析,信息抽取,语言模型 数据概述: 该数据集包含了来自立陶宛金融新闻的文本数据,旨在用于金融领域相关的文本分析任务。主要特征如下: 时间跨度:... -
健康App评论数据集HealthAppsReviewDataset-faysal1998
健康App评论数据集HealthAppsReviewDataset-faysal1998 数据来源:互联网公开数据 标签:健康App,评论,用户评价,自然语言处理,情感分析,移动健康,机器学习,App Store 数据概述: 该数据集包含来自App Store的健康App评论数据,记录了用户对不同健康类App的评价。主要特征如下:... -
中文维基百科词向量与关系抽取数据集ZWRSDataset-BigDataAnalysisforPyTorch-william2777
中文维基百科词向量与关系抽取数据集ZWRSDataset-BigDataAnalysisforPyTorch-william2777 数据来源:互联网公开数据 标签:自然语言处理,词向量,关系抽取,数据集,PyTorch,深度学习,中文,大数据分析 数据概述:... -
印度政治剧帕塔尔洛克IMDB评论数据集PaatalLokIMDBReviewDataset-souren
印度政治剧帕塔尔洛克IMDB评论数据集PaatalLokIMDBReviewDataset-souren 数据来源:互联网公开数据 标签:影视评论,数据集,情感分析,机器学习,文本挖掘,自然语言处理,印度电影,数据分析 数据概述: 该数据集包含来自IMDB网站的用户对印度政治剧《帕塔尔洛克》的评论数据,记录了观众对剧集的评价和反馈。主要特征如下:... -
样本问答数据集SampledQADataDataset-hritik619916
样本问答数据集SampledQADataDataset-hritik619916 数据来源:互联网公开数据 标签:问答系统,数据集,自然语言处理,机器学习,信息检索,文本分析,人工智能,数据挖掘 数据概述: 该数据集包含来自公开来源的问答对样本数据,记录了问题与对应答案的配对信息。主要特征如下:... -
AI对齐领域人机交互质量评估数据集-HelpSteer
AI对齐领域人机交互质量评估数据集-HelpSteer 数据来源:互联网公开数据 标签:AI对齐,人机交互,自然语言处理,数据集,Prompt,响应,评价,可信赖AI,机器学习 数据概述:... -
GermEval18文本分类数据集-thedevastator
GermEval18文本分类数据集-thedevastator 数据来源:互联网公开数据 标签:文本分类,情感分析,主题分类,二元分类,多类分类,自然语言处理,机器学习 数据概述:... -
西班牙语推特数据集SpanishTweetsDataset-furqanamjad
西班牙语推特数据集SpanishTweetsDataset-furqanamjad 数据来源:互联网公开数据 标签:社交媒体,文本分析,情感分析,机器学习,自然语言处理,数据集,语言研究,舆情分析 数据概述: 该数据集包含来自Twitter平台的西班牙语推文数据,记录了用户发布的内容及其相关属性。主要特征如下:... -
语音识别与转录数据集KS0709V-01WhisperOutsDataset-liumail511
语音识别与转录数据集KS0709V-01WhisperOutsDataset-liumail511 数据来源:互联网公开数据 标签:语音识别,数据集,转录,人工智能,自然语言处理,机器学习,语音技术,数据科学 数据概述: 该数据集包含来自KS0709V-01项目的语音识别与转录数据,记录了不同场景下的语音内容及其对应的文本转录。主要特征如下:... -
句子情感分析数据集AspectSentenceCSVDataset-costleyosaro
句子情感分析数据集AspectSentenceCSVDataset-costleyosaro 数据来源:互联网公开数据 标签:情感分析,文本挖掘,自然语言处理,数据集,评论分析,机器学习,情感分类,中文文本 数据概述: 该数据集包含来自用户评论的句子数据,旨在用于情感分析任务。主要特征如下:... -
多语言翻译应用性能评估数据集
多语言翻译应用性能评估数据集 数据来源:互联网公开数据 标签:翻译应用,多语言支持,翻译质量,用户评价,性能评估,自然语言处理,机器学习 数据概述:... -
情感分析测试数据集ABSATestDataset-ndycuongnguyen
情感分析测试数据集ABSATestDataset-ndycuongnguyen 数据来源:互联网公开数据 标签:情感分析,文本挖掘,自然语言处理,数据集,机器学习,情感分类,评论分析,ABSA 数据概述:该数据集包含用于情感分析(ABSA, Aspect-Based Sentiment... -
情感分析数据集SentimentDetection-ganeshsamarth
情感分析数据集SentimentDetection-ganeshsamarth 数据来源:互联网公开数据 标签:情感分析,文本挖掘,自然语言处理,机器学习,情感分类,数据集,文本情感,情绪识别 数据概述: 该数据集包含用于情感分析的文本数据,记录了各种文本内容的情感倾向。主要特征如下: 时间跨度:数据记录的时间跨度不固定,涵盖了不同时间段的文本数据。... -
亚马逊商品评论数据集AmazonProductReviewsDataset-sovannayak11
亚马逊商品评论数据集AmazonProductReviewsDataset-sovannayak11 数据来源:互联网公开数据 标签:电子商务,商品评论,数据集,文本分析,情感分析,机器学习,消费者行为,自然语言处理 数据概述: 该数据集包含来自亚马逊网站的商品评论数据,记录了消费者对不同商品的评分和评论内容。主要特征如下:... -
股票评论情感分析数据集-longnguyenchi
股票评论情感分析数据集-longnguyenchi 数据来源:互联网公开数据 标签:股票,评论,情感分析,自然语言处理,文本挖掘,金融,机器学习,市场情绪 数据概述: 该数据集包含来自互联网的股票评论数据,记录了用户对股票的评论内容及其对应的情感极性。主要特征如下: 时间跨度:数据记录的时间范围为不确定,取决于数据来源的时间跨度。... -
海湾地区方言数据集GulfDialectsDataset-afifaalawami
海湾地区方言数据集GulfDialectsDataset-afifaalawami 数据来源:互联网公开数据 标签:方言研究,语音识别,自然语言处理,中东语言,文本分析,机器学习,文化研究,语言学 数据概述:该数据集包含来自海湾地区(包括沙特阿拉伯,阿联酋,科威特,卡塔尔,巴林和也门)的方言数据,记录了不同地区方言的语音和文本样本。主要特征如下:... -
泰迪问答系统多语言数据集BengaliandTeluguVersion数据集泰迪QABengali-TeluguDataset-nbroad
泰迪问答系统多语言数据集BengaliandTeluguVersion数据集泰迪QABengali-TeluguDataset-nbroad 数据来源:互联网公开数据 标签:泰迪QA,多语言问答,数据集,自然语言处理,机器学习,文本分类,语言理解,计算机辅助翻译 数据概述: 该数据集包含来自泰迪QA(TYDI...