-
越南语问答数据集VietnameseQuestionAnsweringDataset-tunphmnguynanh
越南语问答数据集VietnameseQuestionAnsweringDataset-tunphmnguynanh 数据来源:互联网公开数据 标签:问答系统, 自然语言处理, 文本理解, 越南语, 信息检索, 机器阅读理解, 语料库, 数据集 数据概述:... -
文本情感分析邮件数据集TextSentimentAnalysisEmailDataset-mar1nes
文本情感分析邮件数据集TextSentimentAnalysisEmailDataset-mar1nes 数据来源:互联网公开数据 标签:情感分析, 文本分类, 邮件数据, 自然语言处理, 数据标注, 情感倾向性, 机器学习, 语料库 数据概述: 该数据集包含经过词形还原处理的邮件文本数据,记录了邮件内容及其对应的情感标签。主要特征如下:... -
电影评论情感分析训练数据集MovieReviewSentimentAnalysisTrainingDataset-gopimali
电影评论情感分析训练数据集MovieReviewSentimentAnalysisTrainingDataset-gopimali 数据来源:互联网公开数据 标签:情感分析, 文本分类, 电影评论, 自然语言处理, 机器学习, 数据标注, 二分类模型, 情感极性 数据概述:... -
孟加拉语段落训练数据集BangaliParaTrainDataset-nilarnabdebnath
孟加拉语段落训练数据集BangaliParaTrainDataset-nilarnabdebnath 数据来源:互联网公开数据 标签:孟加拉语,自然语言处理,数据集,文本分析,机器学习,语言学,文本挖掘,语言技术 数据概述:该数据集包含来自公开来源的孟加拉语段落数据,适用于自然语言处理和机器学习任务。主要特征如下:... -
阿拉伯语方言文本分类数据集ArabicDialectTextClassificationDataset-yousifadel
阿拉伯语方言文本分类数据集ArabicDialectTextClassificationDataset-yousifadel 数据来源:互联网公开数据 标签:阿拉伯语, 方言识别, 文本分类, 自然语言处理, 语言学, 机器学习, 情感分析, 数据集 数据概述:... -
消费者投诉文本分析数据集ConsumerComplaintsTextAnalysisDataset-fabianomunizbelem
消费者投诉文本分析数据集ConsumerComplaintsTextAnalysisDataset-fabianomunizbelem 数据来源:互联网公开数据 标签:消费者投诉, 文本分析, 情感分析, 巴西, 政府数据, 自然语言处理, 投诉处理, 客户反馈 数据概述:... -
推特用户情感分析训练数据集CombinedTwitterDatasetforTraining-shaikhsaadali
推特用户情感分析训练数据集CombinedTwitterDatasetforTraining-shaikhsaadali 数据来源:互联网公开数据 标签:推特,情感分析,文本数据,自然语言处理,机器学习,情感分类,社交媒体,数据集 数据概述:... -
电商平台用户评论情感分析数据集-sivaram42
电商平台用户评论情感分析数据集-sivaram42 数据来源:互联网公开数据 标签:情感分析,用户评论,电商平台,自然语言处理,文本挖掘,机器学习,消费者行为,产品评价 数据概述: 该数据集包含来自电商平台的用户评论数据,记录了用户对商品的评价和情感倾向。主要特征如下: 时间跨度:数据记录的时间范围不明确,但包含了大量历史评论。... -
大型语言模型训练提示数据集LLMPromptTrainDataDataset-kuohsintu
大型语言模型训练提示数据集LLMPromptTrainDataDataset-kuohsintu 数据来源:互联网公开数据 标签:大型语言模型,数据集,自然语言处理,机器学习,文本生成,对话系统,人工智能,语言技术 数据概述:该数据集包含用于训练大型语言模型的提示数据,记录了多种类型的对话和文本生成任务的示例。主要特征如下:... -
音乐流派歌词数据集MusicLyricsbyGenreDataset-novanglus
音乐流派歌词数据集MusicLyricsbyGenreDataset-novanglus 数据来源:互联网公开数据 标签:音乐,歌词,流派,数据集,文本分析,自然语言处理,情感分析,机器学习 数据概述: 该数据集包含了来自互联网的音乐歌词数据,并按音乐流派进行了分类。主要特征如下: 时间跨度: 数据记录的时间范围跨越多年,具体取决于歌词的发布时间。... -
谷歌应用商店用户评论数据集GooglePlayStoreCustomerReviewsDataset-umerkhangolandaz
谷歌应用商店用户评论数据集GooglePlayStoreCustomerReviewsDataset-umerkhangolandaz 数据来源:互联网公开数据 标签:应用商店,用户评论,情感分析,自然语言处理,数据集,移动应用,文本挖掘,机器学习 数据概述: 该数据集包含来自谷歌应用商店的用户评论数据,记录了用户对不同应用的评价和反馈。主要特征如下:... -
评论翻译与校对数据集CommentsTranslationandProofreadingDataset-yamak1906
评论翻译与校对数据集CommentsTranslationandProofreadingDataset-yamak1906 数据来源:互联网公开数据 标签:自然语言处理,文本翻译,数据集,语言模型,机器学习,文本校对,机器翻译,文本处理 数据概述: 该数据集包含来自互联网的评论数据,记录了不同语言之间的评论翻译与校对信息。主要特征如下:... -
假新闻识别挑战赛数据集HackathonFakeNewsDataset-mknpk01
假新闻识别挑战赛数据集HackathonFakeNewsDataset-mknpk01 数据来源:互联网公开数据 标签:假新闻,数据集,文本分析,新闻分类,机器学习,自然语言处理,信息传播,社会研究 数据概述: 该数据集来自假新闻识别挑战赛,主要记录了各类新闻文章及其真实性标签。主要特征如下: 时间跨度:数据记录的时间范围从2016年到2021年。... -
新闻提供者推文数据集TwitterTwittsfromNewsProvidersDataset-naortedgi
新闻提供者推文数据集TwitterTwittsfromNewsProvidersDataset-naortedgi 数据来源:互联网公开数据 标签:社交媒体,推文,新闻,数据分析,自然语言处理,文本挖掘,舆情分析,传播学 数据概述: 该数据集包含了来自新闻提供者的推文数据,记录了新闻机构在Twitter上的发布信息。主要特征如下:... -
软件代码数据集SoftwareCodeDataset-joshuwamiller
软件代码数据集SoftwareCodeDataset-joshuwamiller 数据来源:互联网公开数据 标签:软件工程,代码分析,数据集,机器学习,自然语言处理,人工智能,编码规范,技术文档 数据概述: 该数据集包含来自多个开源项目的软件代码数据,记录了不同编程语言的源代码及其相关技术文档。主要特征如下:... -
新闻推荐系统数据集NewsRecommendationDataset-mitul777
新闻推荐系统数据集NewsRecommendationDataset-mitul777 数据来源:互联网公开数据 标签:新闻推荐,数据集,推荐系统,机器学习,自然语言处理,信息检索,用户体验,数据挖掘 数据概述: 该数据集专注于新闻推荐领域,记录了用户与新闻内容的交互行为,适用于新闻推荐系统的研究与开发。主要特征如下:... -
情感分析GPT-NEO16B嵌入数据集EmotionGPT-Neo16BEmbeddingsDataset-barelydedicated
情感分析GPT-NEO16B嵌入数据集EmotionGPT-Neo16BEmbeddingsDataset-barelydedicated 数据来源:互联网公开数据 标签:情感分析,自然语言处理,嵌入技术,机器学习,数据集,深度学习,文本分类,人工智能 数据概述: 该数据集包含使用GPT-NEO... -
图像标注数据集DataImageCaptioningDataset-whynamee
图像标注数据集DataImageCaptioningDataset-whynamee 数据来源:互联网公开数据 标签:图像标注,数据集,计算机视觉,自然语言处理,深度学习,图像描述,文本生成,人工智能 数据概述: 该数据集包含图像及其对应的文本描述,旨在用于训练和评估图像标注模型。主要特征如下: 时间跨度:数据记录的时间跨度不限,持续更新。... -
世宗人工智能挑战赛数据集SejongAIChallengeDataset-mkpuro
世宗人工智能挑战赛数据集SejongAIChallengeDataset-mkpuro 数据来源:互联网公开数据 标签:人工智能,数据集,自然语言处理,文本分类,机器翻译,情感分析,语言模型,韩国语 数据概述: 该数据集包含来自世宗人工智能挑战赛的竞赛数据,主要涉及韩国语的文本处理任务。主要特征如下: 时间跨度:数据记录的时间范围为挑战赛期间。... -
基尼亚卢旺达语预训练与微调数据集-kclaude
基尼亚卢旺达语预训练与微调数据集-kclaude 数据来源:互联网公开数据 标签:基尼亚卢旺达语,自然语言处理,数据集,预训练,微调,语言模型,文本数据,非洲语言 数据概述: 该数据集包含了用于基尼亚卢旺达语自然语言处理任务的预训练和微调数据。主要特征如下: 时间跨度:数据记录的时间范围没有明确限制,数据集持续更新,涵盖不同时期的文本资料。...