-
情感分析表情包识别训练数据集SentimentAnalysisEmoticonRecognitionTrainingData-lucca9211
情感分析表情包识别训练数据集SentimentAnalysisEmoticonRecognitionTrainingData-lucca9211 数据来源:互联网公开数据 标签:情感分析, 表情包识别, 文本情感, 机器学习, 自然语言处理, 数据标注, 情感分类, 深度学习 数据概述:... -
评论社区毒性预测提交结果数据集CommunityCommentToxicityPredictionSubmissionResults-mathurinache
评论社区毒性预测提交结果数据集CommunityCommentToxicityPredictionSubmissionResults-mathurinache 数据来源:互联网公开数据 标签:毒性检测, 评论分析, 文本分类, 机器学习, 自然语言处理, 情感分析, 社交媒体, 提交结果 数据概述:... -
图灵基准测试数据集TuringBenchDataset-robikiso
图灵基准测试数据集TuringBenchDataset-robikiso 数据来源:互联网公开数据 标签:人工智能,自然语言处理,数据集,基准测试,模型评估,对话系统,语言模型,机器学习,文本生成 数据概述: 该数据集包含来自图灵基准测试的数据,记录了用于评估人工智能模型在各种任务上的表现,特别是自然语言理解和生成能力。主要特征如下:... -
网络评论毒性检测数据集JigsawHighlyPreprocessedDataset-ganeshgaikwad1
网络评论毒性检测数据集JigsawHighlyPreprocessedDataset-ganeshgaikwad1 数据来源:互联网公开数据 标签:网络评论,毒性检测,数据集,自然语言处理,机器学习,文本分析,社交媒体,数据预处理 数据概述:该数据集来源于Jigsaw竞赛,主要包含经过高度预处理的网络评论数据,适用于 toxicity... -
印地语元音辅音数据集HindiVowelsandConsonantDataset-yashwanths1234
印地语元音辅音数据集HindiVowelsandConsonantDataset-yashwanths1234 数据来源:互联网公开数据 标签:印地语,数据集,语音识别,机器学习,自然语言处理,音素识别,学术资源,语言研究 数据概述:该数据集包含来自印度多所高校的印地语元音和辅音发音数据,记录了不同说话者的发音样本。主要特征如下:... -
LLM特征数据集LLM-DF-FeaturesDataset-alvaromendizabal
LLM特征数据集LLM-DF-FeaturesDataset-alvaromendizabal 数据来源:互联网公开数据 标签:大型语言模型,特征工程,数据集,自然语言处理,机器学习,文本分析,模型评估,人工智能 数据概述: 该数据集包含了从大型语言模型(LLM)中提取的各种特征,旨在用于模型评估、分析和优化。主要特征如下:... -
Reddit新闻数据集RedditNewsDataset-sarahgonzalez
Reddit新闻数据集RedditNewsDataset-sarahgonzalez 数据来源:互联网公开数据 标签:新闻数据,数据集,社交媒体,自然语言处理,文本分析,机器学习,社会研究,信息科学 数据概述: 该数据集包含来自Reddit网站的新闻数据,记录了Reddit平台上发布的各种新闻文章及其相关评论。主要特征如下:... -
语音识别特征数据集WhisperFeaturesDataset-aliaaosamaesmail
语音识别特征数据集WhisperFeaturesDataset-aliaaosamaesmail 数据来源:互联网公开数据 标签:语音识别,特征提取,数据集,人工智能,机器学习,自然语言处理,信号处理,语音技术 数据概述: 该数据集包含来自Whisper语音识别模型的特征数据,记录了语音信号经过模型处理后的特征提取结果。主要特征如下:... -
StableDiffusionv2全提示词数据集StableDiffusionv2AllPromptsDataset-gmhost
StableDiffusionv2全提示词数据集StableDiffusionv2AllPromptsDataset-gmhost 数据来源:互联网公开数据 标签:人工智能,文本生成,图像生成,深度学习,计算机视觉,自然语言处理,机器学习,创意设计 数据概述: 该数据集包含来自Stable Diffusion... -
图像描述生成数据集ImageCaptioningDataset-xxxcccwork
图像描述生成数据集ImageCaptioningDataset-xxxcccwork 数据来源:互联网公开数据 标签:图像识别, 文本生成, 计算机视觉, 自然语言处理, 图像标注, 深度学习, 数据集, 图像描述 数据概述: 该数据集包含图像及其对应的文字描述,旨在用于训练和评估图像描述生成模型。主要特征如下:... -
网球文章数据集TennisArticleDataset-divanshu22
网球文章数据集TennisArticleDataset-divanshu22 数据来源:互联网公开数据 标签:网球,数据集,体育新闻,文本分析,机器学习,自然语言处理,体育研究,新闻数据 数据概述: 该数据集包含来自多个网球新闻来源的文章,记录了关于网球比赛、球员、教练和赛事的相关内容。主要特征如下:... -
文本嵌入与标签数据集TextEmbeddingswithLabelsDataset-ishaaaaan
文本嵌入与标签数据集TextEmbeddingswithLabelsDataset-ishaaaaan 数据来源:互联网公开数据 标签:文本嵌入,自然语言处理,数据集,机器学习,深度学习,标签分类,文本分析,人工智能 数据概述:该数据集包含来自多个来源的文本数据及其对应标签,记录了文本的嵌入特征和分类标签。主要特征如下:... -
亚马逊商品评论测试数据集AmazonProductReviewTestDataset-tbui001
亚马逊商品评论测试数据集AmazonProductReviewTestDataset-tbui001 数据来源:互联网公开数据 标签:电子商务,商品评论,数据集,自然语言处理,情感分析,机器学习,文本挖掘,消费行为 数据概述: 该数据集包含来自亚马逊平台的商品评论数据,记录了消费者对各类商品的评论内容及评分。主要特征如下:... -
教育写作评估主题分析数据集EducationalWritingAssessmentTopicAnalysis-pitinghau
教育写作评估主题分析数据集EducationalWritingAssessmentTopicAnalysis-pitinghau 数据来源:互联网公开数据 标签:写作评估, 文本分析, 教育, 论文分析, 语义分析, 关键词提取, 自然语言处理, 机器学习 数据概述:... -
商品文本分类数据集ProductTextClassificationDataset-bogachevva
商品文本分类数据集ProductTextClassificationDataset-bogachevva 数据来源:互联网公开数据 标签:文本分类, 商品描述, 机器学习, 自然语言处理, 数据标注, 俄语文本, 预训练模型, 数据集 数据概述:... -
布加勒斯特大学机器学习数据集Unibuc-ML2Dataset-thomaspeek
布加勒斯特大学机器学习数据集Unibuc-ML2Dataset-thomaspeek 数据来源:互联网公开数据 标签:机器学习,数据集,分类,回归,文本分析,自然语言处理,学术研究,教育 数据概述: 该数据集由布加勒斯特大学(University of Bucharest)提供,主要用于机器学习和数据挖掘相关的研究和教学。主要特征如下:... -
虚假新闻检测数据集FakeNewsDetectionDataset-saidurabir
虚假新闻检测数据集FakeNewsDetectionDataset-saidurabir 数据来源:互联网公开数据 标签:虚假新闻,新闻分析,自然语言处理,文本分类,机器学习,舆情分析,信息安全,社会科学 数据概述:该数据集包含来自多种来源的虚假新闻和真实新闻数据,用于训练和评估虚假新闻检测模型。主要特征如下:... -
Gemma模型微调综合编码数据集-malakafaqahmad
Gemma模型微调综合编码数据集-malakafaqahmad 数据来源:互联网公开数据 标签:编码,数据集,机器学习,自然语言处理,Gemma,模型微调,代码生成,代码理解 数据概述:该数据集包含用于Gemma模型微调的综合编码数据,旨在提升模型在代码生成、代码理解等任务上的表现。主要特征如下:... -
文本偏见分析与消除数据集TextBiasAnalysisandMitigationDataset-sayakchowdhury99
文本偏见分析与消除数据集TextBiasAnalysisandMitigationDataset-sayakchowdhury99 数据来源:互联网公开数据 标签:文本偏见, 偏见检测, 文本分析, 机器学习, 自然语言处理, 数据集构建, 公平性, 伦理 数据概述:... -
阿拉伯新闻文章标题生成数据集-oussamaseffai
阿拉伯新闻文章标题生成数据集-oussamaseffai 数据来源:互联网公开数据 标签:自然语言处理,文本生成,阿拉伯语,标题生成,机器学习,新闻文章,语言模型,NLP 数据概述: 该数据集包含了阿拉伯语新闻文章及其对应的标题,用于训练和评估阿拉伯语新闻标题生成模型。主要特征如下: 时间跨度:数据记录的时间范围未明确,但涵盖了近期的新闻文章。...