-
多语言文本相似度评估数据集MultilingualTextSimilarityEvaluationDataset-rookiejing
多语言文本相似度评估数据集MultilingualTextSimilarityEvaluationDataset-rookiejing 数据来源:互联网公开数据 标签:文本相似度, 多语言, 语料库, 机器翻译, 自然语言处理, 文本匹配, 语言学, 数据标注 数据概述: 该数据集包含来自不同语言的文本对,记录了文本对之间的相似度评分。主要特征如下:... -
印地语新闻文本情感分析数据集HindiNewsTextSentimentAnalysis-ridhimasinare17
印地语新闻文本情感分析数据集HindiNewsTextSentimentAnalysis-ridhimasinare17 数据来源:互联网公开数据 标签:情感分析, 文本分类, 自然语言处理, 印地语, 新闻文本, 情感极性, 机器学习, 语料库 数据概述: 该数据集包含来自新闻媒体的印地语文本数据,记录了新闻文章的情感极性标签。主要特征如下:... -
星球大战电影剧本语音数据集StarWarsMovieScriptVoiceDataset-adnannoorullah
星球大战电影剧本语音数据集StarWarsMovieScriptVoiceDataset-adnannoorullah 数据来源:互联网公开数据 标签:电影剧本, 语音识别, 文本分析, 角色对话, 数据标注, 自然语言处理, 星球大战, 语料库 数据概述: 该数据集包含来自星球大战电影剧本的语音文本数据,记录了电影中角色的对话内容。主要特征如下:... -
社交媒体推文讽刺识别数据集SocialMediaTweetIronyDetection-lakshmikeerthana
社交媒体推文讽刺识别数据集SocialMediaTweetIronyDetection-lakshmikeerthana 数据来源:互联网公开数据 标签:讽刺识别, 情感分析, 文本分类, 社交媒体, 自然语言处理, 机器学习, 文本标注, 语料库 数据概述: 该数据集包含来自社交媒体平台推文,记录了用于识别推文中讽刺意味的文本。主要特征如下:... -
命名实体识别训练与测试数据集NamedEntityRecognitionTrainingandTestingDataset-binarybae
命名实体识别训练与测试数据集NamedEntityRecognitionTrainingandTestingDataset-binarybae 数据来源:互联网公开数据 标签:命名实体识别, 自然语言处理, 文本标注, 机器学习, 语料库, 实体识别, 文本分析, 标注数据 数据概述:... -
西班牙语评论文本数据集SpanishCommentsTextCorpus-fernandobordi
西班牙语评论文本数据集SpanishCommentsTextCorpus-fernandobordi 数据来源:互联网公开数据 标签:文本分析, 西班牙语, 评论数据, 情感分析, 自然语言处理, 语料库, 文本挖掘, 语言学 数据概述: 该数据集包含来自公开渠道的西班牙语评论文本,记录了用户对不同主题的评论内容。主要特征如下:... -
瑞克与莫蒂剧本台词数据集RickandMortyScriptDialogue-justin2silas
瑞克与莫蒂剧本台词数据集RickandMortyScriptDialogue-justin2silas 数据来源:互联网公开数据 标签:剧本分析, 影视数据, 台词文本, 角色对话, 文本挖掘, 自然语言处理, 动漫, 语料库 数据概述: 该数据集包含来自《瑞克与莫蒂》动画剧集的台词文本,记录了剧集中不同角色之间的对话内容。主要特征如下:... -
印尼语犯罪新闻文本分类数据集IndonesianCriminalNewsTextClassification-idlangrh
印尼语犯罪新闻文本分类数据集IndonesianCriminalNewsTextClassification-idlangrh 数据来源:互联网公开数据 标签:印尼语, 文本分类, 犯罪新闻, 自然语言处理, 语料库, 情感分析, 机器学习, 文本挖掘 数据概述:... -
英语-泰卢固语平行语料翻译数据集English-TeluguParallelCorpus-krizzna69
英语-泰卢固语平行语料翻译数据集English-TeluguParallelCorpus-krizzna69 数据来源:互联网公开数据 标签:机器翻译, 语料库, 语言学, 文本翻译, 英语, 泰卢固语, 自然语言处理, 平行语料 数据概述: 该数据集包含英语与泰卢固语的平行文本,记录了两种语言之间的翻译对应关系。主要特征如下:... -
印度尼西亚语宗教文本翻译数据集IndonesianReligiousTextTranslation-adeliaherlisa91
印度尼西亚语宗教文本翻译数据集IndonesianReligiousTextTranslation-adeliaherlisa91 数据来源:互联网公开数据 标签:印尼语, 宗教文本, 翻译, 文本对齐, 自然语言处理, 机器翻译, 语料库, 文本分析 数据概述: 该数据集包含来自印度尼西亚语的宗教文本,记录了原始文本及其对应的翻译。主要特征如下:... -
印度尼西亚语情感分析数据集IndonesianSentimentAnalysisDataset-dawamaf
印度尼西亚语情感分析数据集IndonesianSentimentAnalysisDataset-dawamaf 数据来源:互联网公开数据 标签:情感分析, 文本分类, 自然语言处理, 印度尼西亚语, 情感标注, 机器学习, 情绪识别, 语料库 数据概述: 该数据集包含来自社交媒体或其他公开渠道的印度尼西亚语文本,记录了不同文本的情感倾向。主要特征如下:... -
性别歧视文本识别数据集SexistTextIdentificationDataset-hudeewu
性别歧视文本识别数据集SexistTextIdentificationDataset-hudeewu 数据来源:互联网公开数据 标签:性别歧视, 文本分类, 情感分析, 社交媒体, 数据标注, 自然语言处理, 语料库, 机器学习 数据概述: 该数据集包含来自社交媒体平台的文本数据,旨在用于识别和分析性别歧视言论。主要特征如下:... -
印地语文本语言识别数据集HindiTextLanguageIdentification-ayushmi77al
印地语文本语言识别数据集HindiTextLanguageIdentification-ayushmi77al 数据来源:互联网公开数据 标签:文本分类, 语言识别, 印地语, 自然语言处理, 文本分析, 多语言, 机器学习, 语料库 数据概述: 该数据集包含印地语文本数据,记录了印地语文本的内容及其对应的语言标签。主要特征如下:... -
西班牙语文本词性标注数据集SpanishTextPart-of-SpeechTaggingDataset-libardolopezdiaz
西班牙语文本词性标注数据集SpanishTextPart-of-SpeechTaggingDataset-libardolopezdiaz 数据来源:互联网公开数据 标签:词性标注, 自然语言处理, 西班牙语, 文本分析, 语言学, 语料库, 文本语料, 机器学习 数据概述:... -
用户意图识别训练数据集UserIntentRecognitionTrainingDataset-joelyu
用户意图识别训练数据集UserIntentRecognitionTrainingDataset-joelyu 数据来源:互联网公开数据 标签:意图识别, 自然语言处理, 文本分类, 对话系统, 机器学习, 语料库, 数据标注, 情感分析 数据概述: 该数据集包含用于训练用户意图识别模型的数据,记录了用户输入的文本与对应的意图类别。主要特征如下:... -
编程语言类型推断关键词数据集ProgrammingLanguageTypeInferenceKeywordsDataset-elvinzhang
编程语言类型推断关键词数据集ProgrammingLanguageTypeInferenceKeywordsDataset-elvinzhang 数据来源:互联网公开数据 标签:类型推断, 编程语言, 关键词提取, 文本分析, 软件工程, 机器学习, 自然语言处理, 语料库 数据概述:... -
电影评论情感分析数据集MovieReviewSentimentAnalysis-intannurrahmania
电影评论情感分析数据集MovieReviewSentimentAnalysis-intannurrahmania 数据来源:互联网公开数据 标签:情感分析, 自然语言处理, 文本分类, 电影评论, 情感极性, 机器学习, 数据标注, 语料库 数据概述: 该数据集包含来自电影评论网站的文本数据,记录了电影评论短语及其对应的情感极性标签。主要特征如下:... -
越南语对话意图识别数据集VietnameseDialogueIntentRecognition-daominhkhanh
越南语对话意图识别数据集VietnameseDialogueIntentRecognition-daominhkhanh 数据来源:互联网公开数据 标签:自然语言处理, 意图识别, 文本分类, 越南语, 对话系统, 机器学习, 语料库, 情感分析 数据概述: 该数据集包含来自daominhkhanh-... -
心理咨询对话生成数据集TherapyDialogueGeneration-tijaniababatunde
心理咨询对话生成数据集TherapyDialogueGeneration-tijaniababatunde 数据来源:互联网公开数据 标签:心理咨询, 情感支持, 对话生成, 自然语言处理, 文本生成, 机器学习, 情感分析, 语料库 数据概述: 该数据集包含来自心理咨询领域的对话示例,记录了用户寻求情感支持时的输入以及治疗师的回复。主要特征如下:... -
孟加拉语文本数据集BengaliTextDataset-nasiatfahim
孟加拉语文本数据集BengaliTextDataset-nasiatfahim 数据来源:互联网公开数据 标签:孟加拉语, 文本数据, 语料库, 自然语言处理, 文本分析, 机器翻译, 情感分析, 语言模型 数据概述: 该数据集包含来自互联网的孟加拉语文本数据,记录了各种主题的孟加拉语文本内容。主要特征如下:...