-
语音识别标注测试数据集SpeechRecognitionAnnotatedTestDataset-brazilserver986k
语音识别标注测试数据集SpeechRecognitionAnnotatedTestDataset-brazilserver986k 数据来源:互联网公开数据 标签:语音识别, 语音数据, 文本标注, 声学模型, 自然语言处理, 语音合成, 机器学习, 语料库 数据概述: 该数据集包含来自 Common Voice... -
电影评论情感分析数据集MovieReviewSentimentAnalysis-rustamusmanov
电影评论情感分析数据集MovieReviewSentimentAnalysis-rustamusmanov 数据来源:互联网公开数据 标签:情感分析, 自然语言处理, 文本分类, 电影评论, 情感极性, 机器学习, 语料库, 情感标注 数据概述:... -
图像描述词频统计数据集ImageDescriptionWordFrequencyStatistics-ritchie46
图像描述词频统计数据集ImageDescriptionWordFrequencyStatistics-ritchie46 数据来源:互联网公开数据 标签:图像描述, 词频统计, 文本分析, 自然语言处理, 计算机视觉, 语料库, 数据挖掘, 图像检索 数据概述:... -
文本情感分析词向量数据集TextSentimentAnalysisWordEmbeddingDataset-sailhan
文本情感分析词向量数据集TextSentimentAnalysisWordEmbeddingDataset-sailhan 数据来源:互联网公开数据 标签:情感分析, 文本分类, 词向量, 自然语言处理, 机器学习, 深度学习, 语料库, 情感词典 数据概述:... -
印地语-英语平行语料翻译数据集Hindi-EnglishParallelCorpusTranslation-dhruvsinghsachan
印地语-英语平行语料翻译数据集Hindi-EnglishParallelCorpusTranslation-dhruvsinghsachan 数据来源:互联网公开数据 标签:机器翻译, 文本翻译, 语料库, 印地语, 英语, 自然语言处理, 语言学, 文本分析 数据概述: 该数据集包含来自互联网的印地语-... -
互联网评论毒性分类数据集InternetCommentToxicityClassificationDataset-mohammedtaharoshan
互联网评论毒性分类数据集InternetCommentToxicityClassificationDataset-mohammedtaharoshan 数据来源:互联网公开数据 标签:文本分类, 毒性检测, 情感分析, 自然语言处理, 机器学习, 评论分析, 负面情绪, 语料库 数据概述:... -
阿里与飒达词汇数据集-farismuq2
阿里与飒达词汇数据集-farismuq2 数据来源:互联网公开数据 标签:词汇分析,数据集,情感分析,自然语言处理,文本挖掘,中文文本,语料库,语言学 数据概述: 该数据集包含了阿里和飒达相关的词汇,旨在用于词汇分析、情感分析等自然语言处理任务。主要特征如下: 时间跨度: 数据记录的时间范围不限,涵盖了从早期到现代的词汇。 地理范围:... -
越南新闻文本摘要数据集VietnameseNewsTextSummarizationDataset-uyentruong
越南新闻文本摘要数据集VietnameseNewsTextSummarizationDataset-uyentruong 数据来源:互联网公开数据 标签:文本摘要, 自然语言处理, 越南语, 机器翻译, 深度学习, 文本生成, 语料库, 数据集 数据概述: 该数据集包含来自越南新闻的文章及其对应的摘要,旨在用于文本摘要任务。主要特征如下:... -
文本摘要生成训练数据集TextSummarizationTrainingDataset-mridul3301
文本摘要生成训练数据集TextSummarizationTrainingDataset-mridul3301 数据来源:互联网公开数据 标签:文本摘要, 自然语言处理, 机器翻译, 深度学习, 文本生成, 数据集构建, 摘要生成, 语料库 数据概述: 该数据集包含用于文本摘要任务的训练数据,记录了源文本及其对应的摘要。主要特征如下:... -
尼泊尔新闻文本数据集NepaliNewsTextDataset-sulavtimilsina
尼泊尔新闻文本数据集NepaliNewsTextDataset-sulavtimilsina 数据来源:互联网公开数据 标签:新闻文本, 尼泊尔语, 文本分类, 自然语言处理, 语料库, 新闻报道, 文本分析, 数据挖掘 数据概述: 该数据集包含来自尼泊尔新闻网站NepaliPatra的文本数据,记录了各种新闻报道的内容。主要特征如下:... -
文本分类邮件数据集TextClassificationEmailDataset-kaushal2896
文本分类邮件数据集TextClassificationEmailDataset-kaushal2896 数据来源:互联网公开数据 标签:文本分类, 邮件, 自然语言处理, 机器学习, 语料库, 预处理, 情感分析, 多分类 数据概述: 该数据集包含来自不同新闻组的邮件文本数据,用于文本分类任务。主要特征如下:... -
多语言翻译平行语料数据集MultilingualTranslationParallelCorpus-juanjosmorenogiraldo
多语言翻译平行语料数据集MultilingualTranslationParallelCorpus-juanjosmorenogiraldo 数据来源:互联网公开数据 标签:机器翻译, 语料库, 自然语言处理, 语言学, 翻译模型, 文本数据, 英语, 德语, 西班牙语 数据概述:... -
写作质量评估文本数据集WritingQualityAssessmentTextDataset-miller0926
写作质量评估文本数据集WritingQualityAssessmentTextDataset-miller0926 数据来源:互联网公开数据 标签:文本分析, 写作质量, 语言评估, 自然语言处理, 文本特征, 机器学习, 语料库, 评估指标 数据概述:... -
情感对话情绪识别数据集EmotionalDialogueOutcomeSentimentDataset-tommasocapacci
情感对话情绪识别数据集EmotionalDialogueOutcomeSentimentDataset-tommasocapacci 数据来源:互联网公开数据 标签:情感分析, 对话情绪识别, 文本情感分类, 情绪标注, 语料库, 自然语言处理, 机器学习, 情感计算 数据概述:... -
电影评论情感分析数据集MovieReviewSentimentAnalysis-harshil0301
电影评论情感分析数据集MovieReviewSentimentAnalysis-harshil0301 数据来源:互联网公开数据 标签:情感分析, 文本分类, 电影评论, 自然语言处理, 情感极性, 机器学习, 语料库, 数据标注 数据概述: 该数据集包含来自互联网的电影评论数据,记录了电影评论文本及其对应的情感极性标签。主要特征如下:... -
多语言维基百科内容翻译对照数据集MultilingualWikipediaContentTranslationDataset-bamps53
多语言维基百科内容翻译对照数据集MultilingualWikipediaContentTranslationDataset-bamps53 数据来源:互联网公开数据 标签:机器翻译, 文本翻译, 多语言, 维基百科, 自然语言处理, 文本对齐, 语料库, 语言学 数据概述:... -
多语言问答上下文理解训练数据集MultilingualQuestionAnsweringContextUnderstandingTrainingDatas...
多语言问答上下文理解训练数据集MultilingualQuestionAnsweringContextUnderstandingTrainingDataset-ranjanrishabh 数据来源:互联网公开数据 标签:问答系统, 自然语言处理, 文本理解, 机器阅读, 多语言, 文本摘要, 语料库, 深度学习 数据概述:... -
社交平台评论毒性识别数据集SocialPlatformCommentToxicityIdentification-nohjihwan
社交平台评论毒性识别数据集SocialPlatformCommentToxicityIdentification-nohjihwan 数据来源:互联网公开数据 标签:文本分类, 毒性检测, 情感分析, 机器学习, 自然语言处理, 评论分析, 深度学习, 语料库 数据概述:... -
印地语-英语平行语料翻译数据集Hindi-EnglishParallelTranslationCorpus-chinmaycp9
印地语-英语平行语料翻译数据集Hindi-EnglishParallelTranslationCorpus-chinmaycp9 数据来源:互联网公开数据 标签:机器翻译, 语料库, 文本翻译, 自然语言处理, 双语数据, 印地语, 英语, 语言模型 数据概述: 该数据集包含来自互联网的印地语-... -
印度多语种文本转录数据集IndianMulti-languageTextTransliterationDataset-jaswanth431
印度多语种文本转录数据集IndianMulti-languageTextTransliterationDataset-jaswanth431 数据来源:互联网公开数据 标签:文本转录, 多语言, 印度语言, 机器翻译, 自然语言处理, 语料库, 语言学, 深度学习 数据概述:...