-
新闻摘要文本分析数据集NewsSummaryTextAnalysis-terrychanorg
新闻摘要文本分析数据集NewsSummaryTextAnalysis-terrychanorg 数据来源:互联网公开数据 标签:新闻摘要, 文本分析, 自然语言处理, 文本摘要, 关键词提取, 语义分析, 机器翻译, 数据标注 数据概述:... -
AI代码生成与解析数据集AI4CodeCrawledDevDataset-yufuin
AI代码生成与解析数据集AI4CodeCrawledDevDataset-yufuin 数据来源:互联网公开数据 标签:人工智能,代码生成,数据集,机器学习,自然语言处理,软件开发,算法研究,编程辅助 数据概述: 该数据集由AI4Code项目提供,主要记录了代码生成与解析相关的数据,适用于代码自动生成、代码理解及编程辅助工具的开发。主要特征如下:... -
图像描述生成与评估数据集EvaluationBLIPFlicker8kDataset-salehelhawaryy
图像描述生成与评估数据集EvaluationBLIPFlicker8kDataset-salehelhawaryy 数据来源:互联网公开数据 标签:图像处理,自然语言处理,数据集,机器学习,视觉描述,深度学习,计算机视觉,人工智能 数据概述: 该数据集由 BLIP 模型在 Flicker8k... -
评论社区内容毒性评估数据集CommunityContentToxicityEvaluation-httpwwwfszyc
评论社区内容毒性评估数据集CommunityContentToxicityEvaluation-httpwwwfszyc 数据来源:互联网公开数据 标签:毒性检测, 文本分类, 情感分析, 社交媒体, 机器学习, 标注数据, 自然语言处理, 社区互动 数据概述: 该数据集包含来自评论社区的文本数据,记录了对评论内容毒性的评估结果。主要特征如下:... -
写作质量特征工程数据集-mcpenguin
写作质量特征工程数据集-mcpenguin 数据来源:互联网公开数据 标签:写作质量,特征工程,自然语言处理,数据集,文本分析,机器学习,语言模型,内容评估 数据概述: 该数据集包含了经过特征工程处理的文本数据,旨在用于评估和预测文本的写作质量。主要特征如下: 时间跨度: 数据集未明确标注时间跨度,但数据来源于不同时间段的文本内容。 地理范围:... -
图像描述生成数据集ImageCaptioningDataset-zainpirzada68
图像描述生成数据集ImageCaptioningDataset-zainpirzada68 数据来源:互联网公开数据 标签:图像描述, 计算机视觉, 自然语言处理, 图像标注, 深度学习, 图像识别, 数据集, 文本生成 数据概述: 该数据集包含图像文件及其对应的文字描述,用于训练和评估图像描述生成模型。主要特征如下:... -
多语言问答文本数据集MultilingualQuestionAnsweringTextDataset-zacchaeus
多语言问答文本数据集MultilingualQuestionAnsweringTextDataset-zacchaeus 数据来源:互联网公开数据 标签:问答系统, 自然语言处理, 文本理解, 阅读理解, 机器阅读, 多语言, 文本标注, 数据集 数据概述: 该数据集包含来自多个来源的问答文本数据,旨在用于评估和训练多语言问答系统。主要特征如下:... -
俄语新闻摘要生成数据集RussianNewsSummarizationDataset-anatoliypan
俄语新闻摘要生成数据集RussianNewsSummarizationDataset-anatoliypan 数据来源:互联网公开数据 标签:文本摘要, 自然语言处理, 俄语, 新闻分析, 机器翻译, 深度学习, 文本生成, 语料库 数据概述: 该数据集包含来自新闻文章的数据,记录了俄语新闻文章的标题、原文文本及其生成的摘要。主要特征如下:... -
英文语音合成数据集EnglishSpeechSynthesisDataset-nirmanor1
英文语音合成数据集EnglishSpeechSynthesisDataset-nirmanor1 数据来源:互联网公开数据 标签:语音合成, 文本转语音, 语音识别, 自然语言处理, 音频数据, LJSpeech, 数据集, 深度学习 数据概述:... -
电影评论情感分析数据集MovieReviewSentimentAnalysis-pulkittarora
电影评论情感分析数据集MovieReviewSentimentAnalysis-pulkittarora 数据来源:互联网公开数据 标签:情感分析, 文本分类, 电影评论, 自然语言处理, 情感极性, 机器学习, 数据标注, 语料库 数据概述: 该数据集包含来自互联网的电影评论文本,记录了每条评论对应的情感极性标签。主要特征如下:... -
电影评论情感分析数据集MovieReviewSentimentAnalysis-davideaguglia
电影评论情感分析数据集MovieReviewSentimentAnalysis-davideaguglia 数据来源:互联网公开数据 标签:情感分析, 文本挖掘, 自然语言处理, 电影评论, 情感分类, 数据标注, 机器学习, 语料库 数据概述: 该数据集包含电影评论数据,记录了观众对电影的情感反馈。主要特征如下:... -
交通出行文本情感分析数据集TransportationTextSentimentAnalysis-tabualkher
交通出行文本情感分析数据集TransportationTextSentimentAnalysis-tabualkher 数据来源:互联网公开数据 标签:文本情感分析, 交通出行, 语料库, 情感分类, 机器学习, 自然语言处理, 交通政策, 环境保护 数据概述:... -
虚假新闻检测文本数据集FakeNewsDetectionTextDataset-sherifsamyabdelkarem
虚假新闻检测文本数据集FakeNewsDetectionTextDataset-sherifsamyabdelkarem 数据来源:互联网公开数据 标签:虚假新闻, 文本分类, 新闻标题, 新闻内容, 自然语言处理, 机器学习, 舆情分析, 文本情感 数据概述:... -
社交媒体情感分析负面情感文本数据集SocialMediaSentimentAnalysisNegativeTextCorpus-mariaeremeeva
社交媒体情感分析负面情感文本数据集SocialMediaSentimentAnalysisNegativeTextCorpus-mariaeremeeva 数据来源:互联网公开数据 标签:情感分析, 文本分类, 负面情绪, 社交媒体, 文本数据, 自然语言处理, 机器学习, 数据标注 数据概述:... -
跨编码器数据集Cross-EncoderDataset-epsilon12345
跨编码器数据集Cross-EncoderDataset-epsilon12345 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本匹配,语义相似度,信息检索,深度学习,模型训练,语言模型 数据概述: 该数据集包含了用于训练和评估跨编码器模型的数据,主要用于提升文本匹配和语义理解的性能。主要特征如下:... -
虚假新闻分类数据集FakeNewsClassificationDataset-rahilmerchant
虚假新闻分类数据集FakeNewsClassificationDataset-rahilmerchant 数据来源:互联网公开数据 标签:虚假新闻,数据集,文本分类,自然语言处理,机器学习,社交媒体,信息验证,新闻分析 数据概述:... -
NIT项目-自然语言处理数据集NITProject-NaturalLanguageProcessingDataset-peculiarview
NIT项目-自然语言处理数据集NITProject-NaturalLanguageProcessingDataset-peculiarview 数据来源:互联网公开数据 标签:自然语言处理,NLP,数据集,文本分析,机器翻译,情感分析,信息抽取,文本分类 数据概述: 该数据集由NIT项目提供,包含了多种自然语言处理任务的文本数据。主要特征如下:... -
IBMDebater论点句子搜索数据集IBMDebaterClaimSentencesSearchDataset-kaggleqrdl
IBMDebater论点句子搜索数据集IBMDebaterClaimSentencesSearchDataset-kaggleqrdl 数据来源:互联网公开数据 标签:自然语言处理,文本挖掘,数据集,论点识别,机器学习,语义分析,学术研究,文本分类 数据概述: 该数据集来源于IBM Debater项目,专注于从文本中提取和识别论点句子。主要特征如下:... -
印地语-英语平行语料库数据集-harshityadavjnu
印地语-英语平行语料库数据集-harshityadavjnu 数据来源:互联网公开数据 标签:机器翻译,自然语言处理,印地语,英语,语料库,语言学,文本分析,跨语言 数据概述:该数据集包含印地语和英语的平行文本数据,旨在用于机器翻译、跨语言信息检索等任务。主要特征如下: 时间跨度:数据记录的时间跨度不明确,取决于语料库的收集时间。... -
人机对话大型语言模型数据集NewHuman-LLMDataset-hozaifazaki99
人机对话大型语言模型数据集NewHuman-LLMDataset-hozaifazaki99 数据来源:互联网公开数据 标签:人机对话,大型语言模型,数据集,自然语言处理,对话生成,情感分析,文本理解,人工智能 数据概述: 该数据集包含人与大型语言模型(LLM)之间的对话记录,旨在促进对LLM在各种对话场景下的性能评估和改进。主要特征如下:...