-
泰卢固语新闻文本主题分类数据集TeluguNewsTextTopicClassificationDataset-shaikfardeen1
泰卢固语新闻文本主题分类数据集TeluguNewsTextTopicClassificationDataset-shaikfardeen1 数据来源:互联网公开数据 标签:泰卢固语, 新闻文本, 文本分类, 自然语言处理, 情感分析, 语料库, 机器翻译, 印度 数据概述:... -
英文文本词对齐数据集EnglishTextWordAlignmentDataset-nairsaanvi
英文文本词对齐数据集EnglishTextWordAlignmentDataset-nairsaanvi 数据来源:互联网公开数据 标签:词对齐, 自然语言处理, 文本分析, 语料库, 机器翻译, 文本处理, 数据标注, 语言学 数据概述: 该数据集包含来自不同来源的英文文本数据,记录了词级别的对齐信息,主要用于研究和开发词对齐模型。主要特征如下:... -
印尼语文本分类语料库数据集IndonesianTextClassificationCorpus-hyadukuoningroqal
印尼语文本分类语料库数据集IndonesianTextClassificationCorpus-hyadukuoningroqal 数据来源:互联网公开数据 标签:文本分类, 印尼语, 语料库, 语言学, 自然语言处理, 文本分析, 情感分析, 机器学习 数据概述: 该数据集包含来自印尼语文本的数据,记录了用于文本分类任务的句子样本。主要特征如下:... -
文学作品作者识别训练数据集LiteraryAuthorIdentificationTrainingDataset-jaycobson51
文学作品作者识别训练数据集LiteraryAuthorIdentificationTrainingDataset-jaycobson51 数据来源:互联网公开数据 标签:文本分析, 作者识别, 自然语言处理, 语料库, 机器学习, EAP, HPL, MWS 数据概述:... -
印尼政治意识形态文本标注数据集IndonesiaPoliticalIdeologyTextLabelingDataset-levinasp
印尼政治意识形态文本标注数据集IndonesiaPoliticalIdeologyTextLabelingDataset-levinasp 数据来源:互联网公开数据 标签:政治, 意识形态, 文本分类, 标注数据, 印尼, 机器学习, 语料库, 自然语言处理 数据概述:... -
阿拉伯语问答数据集ArabicQuestion-AnswerDataset-khaledsayedaaaaa
阿拉伯语问答数据集ArabicQuestion-AnswerDataset-khaledsayedaaaaa 数据来源:互联网公开数据 标签:问答系统, 自然语言处理, 阿拉伯语, 文本生成, 机器翻译, 语义理解, 语料库, 语言模型 数据概述: 该数据集包含阿拉伯语的问答对,记录了问题及其相应的答案。主要特征如下:... -
钢之炼金术师动漫人物对话数据集FullmetalAlchemistAnimeCharacterDialogue-bishalpshrestha
钢之炼金术师动漫人物对话数据集FullmetalAlchemistAnimeCharacterDialogue-bishalpshrestha 数据来源:互联网公开数据 标签:动漫, 文本数据, 角色对话, 语料库, 自然语言处理, 情感分析, 动漫研究, 文本挖掘 数据概述:... -
社交媒体仇恨言论检测数据集SocialMediaHateSpeechDetectionDataset-wolfkissedhehe
社交媒体仇恨言论检测数据集SocialMediaHateSpeechDetectionDataset-wolfkissedhehe 数据来源:互联网公开数据 标签:仇恨言论, 社交媒体, 文本分类, 情感分析, 自然语言处理, 机器学习, 语料库, 舆情分析 数据概述:... -
文本相似度分析数据集TextSimilarityAnalysisDataset-jaagritsingla18
文本相似度分析数据集TextSimilarityAnalysisDataset-jaagritsingla18 数据来源:互联网公开数据 标签:文本相似度, 自然语言处理, 文本匹配, 语义分析, 情感分析, 机器学习, 数据标注, 语料库 数据概述: 该数据集包含来自公开文本资源的数据,记录了用于评估文本相似度的文本对。主要特征如下:... -
文学作品亚里士多德悲剧分析数据集Aristotle-sTragedyAnalysisDataset-rahulstronaut
文学作品亚里士多德悲剧分析数据集Aristotle-sTragedyAnalysisDataset-rahulstronaut 数据来源:互联网公开数据 标签:文学, 悲剧, 亚里士多德, 文本分析, 情感分析, 语料库, 自然语言处理, 古希腊 数据概述:... -
情感分析语料库数据集EmotionAnalysisCorpus-rahulkothasdsd
情感分析语料库数据集EmotionAnalysisCorpus-rahulkothasdsd 数据来源:互联网公开数据 标签:情感分析, 文本分类, 情绪识别, 心理学, 语料库, 自然语言处理, 文本情感, 数据标注 数据概述: 该数据集包含来自ISEAR(International Survey on Emotion Antecedents and... -
机器翻译英法平行语料库数据集MachineTranslationEnglish-FrenchParallelCorpus-architjain128
机器翻译英法平行语料库数据集MachineTranslationEnglish-FrenchParallelCorpus-architjain128 数据来源:互联网公开数据 标签:机器翻译, 文本翻译, 英法翻译, 语料库, 自然语言处理, 双语对照, 文本对齐, 语言模型 数据概述:... -
情绪支持对话语料数据集EmotionalSupportDialogueCorpus-mostafataha12
情绪支持对话语料数据集EmotionalSupportDialogueCorpus-mostafataha12 数据来源:互联网公开数据 标签:情绪支持, 心理健康, 对话分析, 文本生成, 情感识别, 自然语言处理, 语料库, 人工智能 数据概述:... -
情感分析电影评论数据集SentimentAnalysisMovieReviewDataset-orclddapp
情感分析电影评论数据集SentimentAnalysisMovieReviewDataset-orclddapp 数据来源:互联网公开数据 标签:情感分析, 电影评论, 文本数据, 自然语言处理, 情感分类, 文本挖掘, 机器学习, 语料库 数据概述: 该数据集包含来自电影评论网站的评论文本,记录了用户对电影的评价和观点。主要特征如下:... -
中文文本情感分析数据集ChineseTextEmotionAnalysisDataset-camilahwang
中文文本情感分析数据集ChineseTextEmotionAnalysisDataset-camilahwang 数据来源:互联网公开数据 标签:情感分析, 文本分类, 情绪识别, 中文文本, 深度学习, 自然语言处理, 情感标注, 语料库 数据概述: 该数据集包含了来自互联网的中文文本数据,主要用于情感分析和情绪识别任务。主要特征如下:... -
社交媒体俚语缩写释义数据集SocialMediaSlangAcronymExpansion-puyushgupta
社交媒体俚语缩写释义数据集SocialMediaSlangAcronymExpansion-puyushgupta 数据来源:互联网公开数据 标签:俚语, 缩写, 社交媒体, 文本分析, 自然语言处理, 语料库, 语言学, 数据挖掘 数据概述: 该数据集包含来自社交媒体平台的俚语缩写及其对应的完整释义。主要特征如下:... -
法国文本摘要生成训练数据集FrenchTextSummarizationTrainingDataset-lahadmbacke
法国文本摘要生成训练数据集FrenchTextSummarizationTrainingDataset-lahadmbacke 数据来源:互联网公开数据 标签:文本摘要, 法语, 自然语言处理, 机器翻译, 文本生成, 深度学习, 语料库, 摘要模型 数据概述: 该数据集包含来自不同来源的法语文本数据,旨在用于训练文本摘要生成模型。主要特征如下:... -
YouTube视频评论文本数据集YouTubeVideoCommentTextData-mungjae
YouTube视频评论文本数据集YouTubeVideoCommentTextData-mungjae 数据来源:互联网公开数据 标签:YouTube, 视频评论, 文本分析, 自然语言处理, 情感分析, 社交媒体, 数据挖掘, 语料库 数据概述: 该数据集包含来自YouTube平台的视频评论文本数据,记录了用户在特定视频下的评论内容。主要特征如下:... -
乌尔都语罗马音文本情感分析数据集UrduRomanTextSentimentAnalysisDataset-pra1210
乌尔都语罗马音文本情感分析数据集UrduRomanTextSentimentAnalysisDataset-pra1210 数据来源:互联网公开数据 标签:情感分析, 乌尔都语, 罗马音, 文本分类, 自然语言处理, 情感极性, 语料库, 社交媒体 数据概述: 该数据集包含来自社交媒体的乌尔都语罗马音文本数据,记录了用户表达的情感倾向。主要特征如下:... -
新闻文章多语言信息数据集NewsArticlesMultilingualInformation-priyanka183
新闻文章多语言信息数据集NewsArticlesMultilingualInformation-priyanka183 数据来源:互联网公开数据 标签:新闻文章, 多语言, 文本分析, 关键词提取, 文本摘要, 自然语言处理, 语料库, 信息检索 数据概述:...