-
越南语句情感分析数据集-taitruong256
越南语句情感分析数据集-taitruong256 数据来源:互联网公开数据 标签:越南语,情感分析,NLP,数据集,文本处理,机器学习,自然语言处理,语言学 数据概述: 该数据集包含来自越南语的句子及其对应的情感标签,用于情感分析任务。主要特征如下: 时间跨度:数据记录的时间范围跨度不明确,但包含多个不同时期的越南语文本。... -
语言纠错词汇校对数据集LanguageCorrectionVocabularyCalibrationDataset-yeoyunsianggeremie
语言纠错词汇校对数据集LanguageCorrectionVocabularyCalibrationDataset-yeoyunsianggeremie 数据来源:互联网公开数据 标签:语言校对, 文本处理, 词汇纠错, 语法检查, 自然语言处理, 语言模型, 词典, 数据集 数据概述:... -
千言实体链接预处理数据集-kejiewang
千言实体链接预处理数据集-kejiewang 数据来源:互联网公开数据 标签:自然语言处理,实体链接,数据集,中文,文本处理,信息抽取,知识图谱,预处理 数据概述: 该数据集包含经过预处理的中文文本数据,旨在用于实体链接任务。数据的主要特征如下: 时间跨度:数据未明确标注时间范围,主要聚焦于文本内容本身。... -
评论翻译与校对数据集CommentsTranslationandProofreadingDataset-yamak1906
评论翻译与校对数据集CommentsTranslationandProofreadingDataset-yamak1906 数据来源:互联网公开数据 标签:自然语言处理,文本翻译,数据集,语言模型,机器学习,文本校对,机器翻译,文本处理 数据概述: 该数据集包含来自互联网的评论数据,记录了不同语言之间的评论翻译与校对信息。主要特征如下:... -
拉丁字母字母表数据集A-ZAlphabetDataset-pruthwirajghadge
拉丁字母字母表数据集A-ZAlphabetDataset-pruthwirajghadge 数据来源:互联网公开数据 标签:字母表,数据集,字符识别,机器学习,教育,计算机视觉,人工智能,文本处理 数据概述: 该数据集包含拉丁字母表中的字母数据,记录了A到Z每个字母的视觉表示或编码信息。主要特征如下:... -
聊天数据处理后的多模态数据集ChatDataProcessed-MPDataset-monicapatel2203
聊天数据处理后的多模态数据集ChatDataProcessed-MPDataset-monicapatel2203 数据来源:互联网公开数据 标签:多模态,聊天数据,文本处理,图像分析,音频处理,自然语言处理,机器学习,数据挖掘 数据概述: 该数据集包含经过处理的多模态聊天数据,整合了文本、图像和音频信息,旨在为多模态研究和应用提供支持。主要特征如下:... -
消费者评论摘要数据集Review-SumConsumerReviewSummaryDataset-harshalkarangale
消费者评论摘要数据集Review-SumConsumerReviewSummaryDataset-harshalkarangale 数据来源:互联网公开数据 标签:消费者评论,文本摘要,数据集,自然语言处理,情感分析,机器学习,文本处理,数据挖掘 数据概述:... -
机器学习模型训练与测试数据集MachineLearningModelTrainingandTestingDatasets-goldenlock
机器学习模型训练与测试数据集MachineLearningModelTrainingandTestingDatasets-goldenlock 数据来源:互联网公开数据 标签:机器学习, 模型训练, 测试数据集, 数据集, 文本处理, 图像识别, 结构化数据, TensorFlow 数据概述:... -
客户服务对话问答数据集CustomerServiceDialogueQuestionandAnswerDataset-franborjavalero
客户服务对话问答数据集CustomerServiceDialogueQuestionandAnswerDataset-franborjavalero 数据来源:互联网公开数据 标签:客户服务, 对话分析, 问答系统, 文本处理, 自然语言处理, 情感分析, 数据标注, 机器学习 数据概述:... -
Jigsaw翻译与清洗数据集JigsawTranslatedCleanedDataset-jerryqu
Jigsaw翻译与清洗数据集JigsawTranslatedCleanedDataset-jerryqu 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分类,情感分析,机器学习,数据清洗,翻译数据,文本处理 数据概述:... -
歌词分割数据集SplitLyricDataset-lehoanglonglong
歌词分割数据集SplitLyricDataset-lehoanglonglong 数据来源:互联网公开数据 标签:歌词,文本处理,数据集,自然语言处理,机器学习,文本分割,音乐分析,歌词识别 数据概述: 该数据集包含来自多种来源的歌词文本,记录了不同歌曲的歌词内容,并将其分割成单词或短语。主要特征如下:... -
内容清洗数据集Content-CleanedDataDataset-trngththanhh
内容清洗数据集Content-CleanedDataDataset-trngththanhh 数据来源:互联网公开数据 标签:数据清洗,数据集,文本处理,自然语言处理,数据预处理,数据质量,机器学习,数据挖掘 数据概述: 该数据集包含经过清洗和标准化的文本数据,记录了从互联网公开来源收集的内容,并进行了去噪、去重和格式统一等处理。主要特征如下:... -
客户服务对话问答数据集CustomerServiceDialogueQuestionandAnswerDataset-ouchtoubaneabdou
客户服务对话问答数据集CustomerServiceDialogueQuestionandAnswerDataset-ouchtoubaneabdou 数据来源:互联网公开数据 标签:客户服务, 对话分析, 问答系统, 文本处理, 情感分析, 自然语言处理, 数据标注, 机器学习 数据概述:... -
维基百科如何文章摘要数据集WikiHowSummarizationDataset-varunucl
维基百科如何文章摘要数据集WikiHowSummarizationDataset-varunucl 数据来源:互联网公开数据 标签:自然语言处理,文本摘要,数据集,机器学习,人工智能,信息提取,文本处理,教育技术 数据概述: 该数据集包含来自维基百科“如何”类文章的文本及其对应的摘要,记录了各类操作指南和教程的详细内容和简明摘要。主要特征如下:... -
机器学习模型训练数据集MachineLearningModelTrainingDataset-ethanzhang9371
机器学习模型训练数据集MachineLearningModelTrainingDataset-ethanzhang9371 数据来源:互联网公开数据 标签:机器学习, 模型训练, 文本处理, 数据集, 预训练模型, 自然语言处理, 深度学习, 数据样本 数据概述:... -
孟加拉语文本分句与分割数据集BengaliTextSentenceSegmentationandSplitDataset-jjleesunny
孟加拉语文本分句与分割数据集BengaliTextSentenceSegmentationandSplitDataset-jjleesunny 数据来源:互联网公开数据 标签:孟加拉语, 文本处理, 分句, 文本分割, 自然语言处理, 语料库, 机器学习, 语言学 数据概述:... -
文本信息处理与索引数据集TextProcessingandIndexingDataset-aryanp2702
文本信息处理与索引数据集TextProcessingandIndexingDataset-aryanp2702 数据来源:互联网公开数据 标签:文本处理, 索引, 信息检索, 语料库, 关键词提取, 机器学习, 自然语言处理, 数据清洗 数据概述: 该数据集包含来自不同来源的文本数据,记录了经过处理的文本内容及其对应的索引信息。主要特征如下:... -
俄语推特情感分析数据集RussianTweetsSentimentAnalysisDataset-denislysov
俄语推特情感分析数据集RussianTweetsSentimentAnalysisDataset-denislysov 数据来源:互联网公开数据 标签:情感分析, 俄语, 文本处理, 自然语言处理, 机器学习, 文本预处理, 词干提取, 二分类 数据概述: 该数据集包含来自推特的俄语文本数据,用于情感分析研究。主要特征如下:... -
文本增强语料数据集TextAugmentationCorpus-fareedmohamed
文本增强语料数据集TextAugmentationCorpus-fareedmohamed 数据来源:互联网公开数据 标签:文本增强, 数据增强, 自然语言处理, 文本生成, 机器学习, 噪声注入, 文本处理, 语料库 数据概述: 该数据集包含经过文本增强处理的语料,记录了原始文本及其对应的增强版本,主要用于训练和评估文本增强模型。主要特征如下:... -
孟加拉语-英语语言分类合成权重数据集-nazmuddhohaansary
孟加拉语-英语语言分类合成权重数据集-nazmuddhohaansary 数据来源:互联网公开数据 标签:语言分类,数据集,机器学习,文本处理,自然语言处理,孟加拉语,英语,合成数据 数据概述: 该数据集包含了用于孟加拉语和英语语言分类任务的合成数据,旨在评估和训练语言识别模型。主要特征如下:...