-
文本分类模型训练数据集TextClassificationModelTrainingDataset-chabanemafaza
文本分类模型训练数据集TextClassificationModelTrainingDataset-chabanemafaza 数据来源:互联网公开数据 标签:文本分类, 深度学习, 自然语言处理, 情感分析, 文本预处理, 词嵌入, 模型训练, 机器学习 数据概述:... -
互联网热门表情包图像与元数据数据集InternetPopularMemesImage-MetadataDataset-schesa
互联网热门表情包图像与元数据数据集InternetPopularMemesImage-MetadataDataset-schesa 数据来源:互联网公开数据 标签:表情包, 图像识别, 文本分析, 社交媒体, 数据挖掘, 自然语言处理, 情感分析, 图像分类 数据概述:... -
代码单元重排模型训练与评估数据集CodeCellReorderingModelTrainingandEvaluationDataset-goldenlock
代码单元重排模型训练与评估数据集CodeCellReorderingModelTrainingandEvaluationDataset-goldenlock 数据来源:互联网公开数据 标签:代码重排, 机器学习, 文本序列, 模型训练, 评估, 深度学习, 自然语言处理, 代码分析 数据概述:... -
天气文本挖掘数据集DaconTextMiningWeatherDataset-nanzonnaqt
天气文本挖掘数据集DaconTextMiningWeatherDataset-nanzonnaqt 数据来源:互联网公开数据 标签:文本挖掘,天气数据,数据集,自然语言处理,机器学习,预测分析,数据科学,环境研究 数据概述: 该数据集包含来自Dacon平台的天气文本数据,记录了与天气相关的文本信息。主要特征如下:... -
华尔街赌注论坛股票讨论数据集WallStreetBetsData-StockDiscussionDataset-mathieucayssol
华尔街赌注论坛股票讨论数据集WallStreetBetsData-StockDiscussionDataset-mathieucayssol 数据来源:互联网公开数据 标签:股票,金融,社交媒体,数据集,文本分析,情感分析,自然语言处理,华尔街 数据概述: 该数据集包含来自 Reddit 社交平台华尔街赌注(WallStreetBets,简称... -
检索增强生成数据集Retrieval-AugmentedGenerationDataset-sanjarbek1
检索增强生成数据集Retrieval-AugmentedGenerationDataset-sanjarbek1 数据来源:互联网公开数据 标签:自然语言处理,人工智能,数据集,信息检索,文本生成,机器学习,知识增强,语义理解 数据概述: 该数据集包含用于检索增强生成(Retrieval-Augmented... -
大型语言模型与人类在机器学习分类任务中的表现对比数据集LLMvsHumanMLClassifiersDataset-mohamedlotfy50
大型语言模型与人类在机器学习分类任务中的表现对比数据集LLMvsHumanMLClassifiersDataset-mohamedlotfy50 数据来源:互联网公开数据 标签:机器学习,语言模型,分类任务,性能对比,人工智能,数据分析,模型评估,自然语言处理 数据概述: 该数据集专注于对比大型语言模型(Large Language Models,... -
图像识别标注阿拉伯语数据集ImageRecognitionAnnotatedArabicDataset-logainsaleem
图像识别标注阿拉伯语数据集ImageRecognitionAnnotatedArabicDataset-logainsaleem 数据来源:互联网公开数据 标签:图像识别, 阿拉伯语, 文本标注, 计算机视觉, 语义分析, 数据集, 机器学习, 自然语言处理 数据概述:... -
乔-罗根单人演讲转写数据集JoeRoganSingleSpeakerTranscribedDataset-gurvindersinghyadav
乔-罗根单人演讲转写数据集JoeRoganSingleSpeakerTranscribedDataset-gurvindersinghyadav 数据来源:互联网公开数据 标签:语音识别,转写数据,单声道,数据集,自然语言处理,音频分析,机器学习,内容挖掘 数据概述:... -
阿拉伯语新闻摘要数据集ArabicNewsArticlesSummaryDataset-aymanmohamed104
阿拉伯语新闻摘要数据集ArabicNewsArticlesSummaryDataset-aymanmohamed104 数据来源:互联网公开数据 标签:新闻摘要, 阿拉伯语, 文本摘要, 自然语言处理, 文本分析, 舆情分析, 语言模型, 摘要生成 数据概述:... -
美国密歇根大学学生行为数据集UMSIBotDataset-mohamedrashad102
美国密歇根大学学生行为数据集UMSIBotDataset-mohamedrashad102 数据来源:互联网公开数据 标签:学生行为,数据集,自然语言处理,文本分析,社交媒体,情感分析,机器学习,教育 数据概述: 该数据集包含来自密歇根大学信息学院(UMSI)学生在社交媒体上的公开互动数据,记录了学生在各种在线平台上的行为和内容。主要特征如下:... -
文本语义相似度判断数据集TextualSemanticSimilarityJudgmentDataset-subhojeet12134
文本语义相似度判断数据集TextualSemanticSimilarityJudgmentDataset-subhojeet12134 数据来源:互联网公开数据 标签:语义相似度, 文本匹配, 自然语言处理, 文本对比, 句子对, 机器学习, 数据标注, 深度学习 数据概述:... -
BKAI文档数据集BKAIDocumentDataset-phucnguyenlamp
BKAI文档数据集BKAIDocumentDataset-phucnguyenlamp 数据来源:互联网公开数据 标签:BKAI,文档处理,数据集,自然语言处理,机器学习,文本分析,信息检索,人工智能 数据概述:该数据集包含来自BKAI的文档数据,记录了多种类型的文档信息,适用于自然语言处理和机器学习任务。主要特征如下:... -
Ola与Uber客户评论分析数据集OlaandUberCustomerReviewAnalysisDataset-mahirastogi
Ola与Uber客户评论分析数据集OlaandUberCustomerReviewAnalysisDataset-mahirastogi 数据来源:互联网公开数据 标签:客户评论,数据集,情感分析,机器学习,交通出行,消费者行为,自然语言处理,服务评价 数据概述:... -
快速AI语言模型训练数据集FastAIWt103LanguageModelTrainingDataset-aunghtayah
快速AI语言模型训练数据集FastAIWt103LanguageModelTrainingDataset-aunghtayah 数据来源:互联网公开数据 标签:自然语言处理,语言模型,数据集,深度学习,文本分类,文本生成,机器学习,AI研究 数据概述:... -
伪推理数据集Pseudo-InferenceDataset2-black99ylunar
伪推理数据集Pseudo-InferenceDataset2-black99ylunar 数据来源:互联网公开数据 标签:伪推理,数据集,自然语言处理,机器学习,文本生成,深度学习,人工智能,语言模型 数据概述: 该数据集包含用于自然语言处理和机器学习任务中的伪推理数据,记录了文本生成和推理任务中的输入输出对。主要特征如下:... -
文档检索数据集Retrieval-DocumentDataset-hlv305
文档检索数据集Retrieval-DocumentDataset-hlv305 数据来源:互联网公开数据 标签:文档检索,数据集,信息检索,自然语言处理,机器学习,文本分析,人工智能,搜索引擎 数据概述: 该数据集包含来自多个来源的文档数据,记录了文档内容及其相关检索信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。... -
波斯语新闻数据集PersianNewsDataset-fatemehmahdibabaee
波斯语新闻数据集PersianNewsDataset-fatemehmahdibabaee 数据来源:互联网公开数据 标签:新闻,波斯语,数据集,自然语言处理,文本分析,机器学习,多语言,数据挖掘 数据概述: 该数据集包含来自波斯语新闻媒体的文章数据,记录了波斯语新闻的文本内容。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。... -
深度排名数据集DeepRankingDataset-asad1m9a9h6mood
深度排名数据集DeepRankingDataset-asad1m9a9h6mood 数据来源:互联网公开数据 标签:深度学习,排名,数据集,信息检索,推荐系统,排序算法,机器学习,自然语言处理 数据概述: 该数据集包含用于深度学习排序任务的数据,旨在评估和改进各种排序算法。主要特征如下: 时间跨度:... -
Reddit评论文本情感分析数据集-maggiemoma
Reddit评论文本情感分析数据集-maggiemoma 数据来源:互联网公开数据 标签:情感分析,社交媒体,文本挖掘,自然语言处理,数据集,机器学习,Reddit,评论 数据概述:该数据集包含来自 Reddit 平台的评论文本数据,用于情感分析任务。主要特征如下: 时间跨度:数据记录的时间范围为不确定,具体取决于数据集的创建时间。...