-
大型语言模型性能测试数据集LLMPerformanceInstanceTestDataset-datasontran
大型语言模型性能测试数据集LLMPerformanceInstanceTestDataset-datasontran 数据来源:互联网公开数据 标签:大型语言模型,性能测试,数据集,自然语言处理,机器学习,模型评估,人工智能,文本分析 数据概述:该数据集包含来自公开数据源的测试样本,用于评估大型语言模型的性能。主要特征如下:... -
自然语言处理与情感分析数据集NLP-4-5M-Clean-SentencesDataset-amardura
自然语言处理与情感分析数据集NLP-4-5M-Clean-SentencesDataset-amardura 数据来源:互联网公开数据 标签:自然语言处理,情感分析,数据集,文本分类,机器学习,数据挖掘,人工智能,语言模型 数据概述: 该数据集包含来自多个来源的清洗后的句子数据,记录了用于自然语言处理和情感分析任务的高质量文本内容。主要特征如下:... -
比特币社交媒体情绪分析数据集BitcoinSocialMediaSentimentAnalysisDataset-afterrain007
比特币社交媒体情绪分析数据集BitcoinSocialMediaSentimentAnalysisDataset-afterrain007 数据来源:互联网公开数据 标签:比特币,社交媒体,情绪分析,数据集,自然语言处理,金融分析,机器学习,情感计算 数据概述:... -
情感识别与代码生成数据集EmotionCodeMLDataset-jadrabhi
情感识别与代码生成数据集EmotionCodeMLDataset-jadrabhi 数据来源:互联网公开数据 标签:情感分析,代码生成,数据集,机器学习,自然语言处理,情感识别,人工智能,编程辅助 数据概述: 该数据集包含来自情感识别与代码生成领域的数据,记录了情感表达与代码生成任务的相关信息。主要特征如下: 时间跨度:... -
安然公司邮件主题分类数据集EnronEmailSubjectClassificationDataset-kadasingh
安然公司邮件主题分类数据集EnronEmailSubjectClassificationDataset-kadasingh 数据来源:互联网公开数据 标签:邮件数据, 文本分类, 自然语言处理, 情感分析, 邮件主题, 数据挖掘, 商业邮件, Enron 数据概述:... -
医学图像问答数据集MedVQA-GI-ntdatwork
医学图像问答数据集MedVQA-GI-ntdatwork 数据来源:互联网公开数据 标签:医学影像,问答,深度学习,自然语言处理,图像识别,数据集,医学,人工智能 数据概述: 该数据集包含来自医学影像的图像和相应的问答对,旨在促进医学影像理解和问答系统的研究。主要特征如下: 时间跨度:数据记录的时间跨度涵盖了医学影像的常见应用时期。... -
文本数据常用词汇统计分析数据集TextDataCommonWordStatisticsAnalysis-shivamanhar
文本数据常用词汇统计分析数据集TextDataCommonWordStatisticsAnalysis-shivamanhar 数据来源:互联网公开数据 标签:文本分析, 词频统计, 自然语言处理, 语料库, 数据清洗, 文本预处理, 基础词汇, 数据集 数据概述:... -
Flickr8k验证集图像描述数据集Flickr8kValidationImageCaptionDataset-salehelhawaryy
Flickr8k验证集图像描述数据集Flickr8kValidationImageCaptionDataset-salehelhawaryy 数据来源:互联网公开数据 标签:图像描述,数据集,计算机视觉,自然语言处理,图像标注,多模态,文本生成,机器学习 数据概述:... -
诗歌创作与分析数据集PoemsData-lisaameliewittmann
诗歌创作与分析数据集PoemsData-lisaameliewittmann 数据来源:互联网公开数据 标签:诗歌,数据集,自然语言处理,文本分析,情感分析,文学研究,创作,NLP 数据概述: 该数据集包含了来自互联网的各类诗歌作品,旨在为诗歌创作与分析提供数据支持。主要特征如下: 时间跨度:数据记录的时间跨度涵盖了从古代到现代的诗歌作品。... -
俄语文本情感分析与语义理解数据集RussianTextSentimentAnalysisandSemanticUnderstandingDataset-yaustal
俄语文本情感分析与语义理解数据集RussianTextSentimentAnalysisandSemanticUnderstandingDataset-yaustal 数据来源:互联网公开数据 标签:俄语, 文本情感分析, 语义分析, 自然语言处理, 文本语料库, 情感标注, 词性标注, 文本挖掘 数据概述:... -
新闻文本真伪性评估数据集NewsTextTruthfulnessAssessmentDataset-akshaynarayananb
新闻文本真伪性评估数据集NewsTextTruthfulnessAssessmentDataset-akshaynarayananb 数据来源:互联网公开数据 标签:新闻真伪, 文本分类, 事实核查, 情感分析, 舆情分析, 自然语言处理, 机器学习, 文本标注 数据概述:... -
Zalo人工智能公开测试数据集-gigggggge
Zalo人工智能公开测试数据集-gigggggge 数据来源:互联网公开数据 标签:人工智能,数据集,自然语言处理,文本分类,情感分析,机器学习,语义理解,Zalo 数据概述: 该数据集包含来自Zalo人工智能公开测试的数据,主要用于自然语言处理任务。主要特征如下: 时间跨度:数据记录的时间范围未知,但反映了Zalo人工智能系统在特定时间段内的表现。... -
土耳其新闻文本分类数据集TurkishNewsTextClassificationDataset-erythropygia
土耳其新闻文本分类数据集TurkishNewsTextClassificationDataset-erythropygia 数据来源:互联网公开数据 标签:新闻文本, 文本分类, 自然语言处理, 土耳其语, 舆情分析, 关键词提取, 政治新闻, 深度学习 数据概述:... -
学术论文文本分类数据集AcademicPaperTextClassification-qwenzo
学术论文文本分类数据集AcademicPaperTextClassification-qwenzo 数据来源:互联网公开数据 标签:文本分类, 学术论文, 自然语言处理, 机器学习, 论文摘要, 论文标题, 论文结构, Scigen 数据概述: 该数据集包含来自互联网的学术论文数据,记录了论文的标题、摘要、引言、结论以及分类标签。主要特征如下:... -
多语言恶意评论检测数据集MultilingualToxicCommentDetectionDataset-alphaecho
多语言恶意评论检测数据集MultilingualToxicCommentDetectionDataset-alphaecho 数据来源:互联网公开数据 标签:文本分类, 恶意评论, 多语言, 自然语言处理, 情感分析, 语言模型, 文本清洗, 机器学习 数据概述:... -
纽约市新闻数据集NYCNewsDataDataset-srishti280992
纽约市新闻数据集NYCNewsDataDataset-srishti280992 数据来源:互联网公开数据 标签:新闻分析,数据集,文本挖掘,信息提取,自然语言处理,城市研究,媒体分析,社会研究 数据概述:该数据集包含来自纽约市的新闻数据,记录了纽约市各类新闻事件的详细信息。主要特征如下: 时间跨度:数据记录的时间范围从2015年到2020年。... -
Windows系统注释数据集-luckyrxy
Windows系统注释数据集-luckyrxy 数据来源:互联网公开数据 标签:Windows,操作系统,数据集,注释,软件工程,文本分析,自然语言处理,信息检索 数据概述: 该数据集包含Windows操作系统相关的注释信息,旨在提供关于Windows系统功能、代码、API等的详细描述。主要特征如下:... -
越南语文本纠错数据集VietnameseTextErrorCorrectionDataset-khanhdaom
越南语文本纠错数据集VietnameseTextErrorCorrectionDataset-khanhdaom 数据来源:互联网公开数据 标签:越南语, 文本纠错, 自然语言处理, 错误检测, 文本校对, 机器学习, 深度学习, 语料库 数据概述:... -
阿拉伯语文本去标点数据集ArabicTextDotlessDataset-ouassimbehlil
阿拉伯语文本去标点数据集ArabicTextDotlessDataset-ouassimbehlil 数据来源:互联网公开数据 标签:阿拉伯语, 文本处理, 文本清洗, 自然语言处理, 语言模型, 字符级分析, 数据预处理, 语料库 数据概述: 该数据集包含经过处理的阿拉伯语文本,记录了原始文本及其对应的去标点版本。主要特征如下:... -
BUET神经机器翻译数据集BUET神经机器翻译数据集-jakir57
BUET神经机器翻译数据集BUET神经机器翻译数据集-jakir57 数据来源:互联网公开数据 标签:神经机器翻译,数据集,自然语言处理,机器学习,语言学,多语言,翻译技术,数据驱动 数据概述: 该数据集由布里斯托大学工程技术学院提供,专注于神经机器翻译任务,包含多种语言的平行语料库。主要特征如下:...