-
印度语仇恨言论检测数据集HindiHateSpeechDetection-hilloltabasshum
印度语仇恨言论检测数据集HindiHateSpeechDetection-hilloltabasshum 数据来源:互联网公开数据 标签:仇恨言论, 印度语, 文本分类, 情感分析, 社交媒体, 语言学, 恶意内容检测, 多标签分类 数据概述:... -
提格雷语情感分析数据集TigrinyaLanguageEmotionAnalysisDataset-rookiejing
提格雷语情感分析数据集TigrinyaLanguageEmotionAnalysisDataset-rookiejing 数据来源:互联网公开数据 标签:情感分析, 提格雷语, 文本分类, 多标签分类, 情绪识别, 自然语言处理, 语言学, 机器学习 数据概述: 该数据集包含来自公开渠道的提格雷语文本,记录了文本的情感标签。主要特征如下:... -
多语言数字转录数据集MultilingualNumberTranscriptionDataset-shubhamprakash108
多语言数字转录数据集MultilingualNumberTranscriptionDataset-shubhamprakash108 数据来源:互联网公开数据 标签:多语言, 数字转录, 语音识别, 文本翻译, 语言学, 数据集, 文本处理, 机器翻译 数据概述: 该数据集包含多种语言的数字转录数据,记录了数字与其在不同语言中的对应表达。主要特征如下:... -
社交媒体仇恨言论识别数据集SocialMediaHateSpeechDetection-eombui
社交媒体仇恨言论识别数据集SocialMediaHateSpeechDetection-eombui 数据来源:互联网公开数据 标签:仇恨言论, 社交媒体, 文本分类, 情感分析, 语言学, 机器学习, 自然语言处理, 舆情分析 数据概述:... -
命名实体识别西班牙语与荷兰语数据集NamedEntityRecognitionSpanishandDutchDataset-orlandc
命名实体识别西班牙语与荷兰语数据集NamedEntityRecognitionSpanishandDutchDataset-orlandc 数据来源:互联网公开数据 标签:命名实体识别, NLP, 自然语言处理, 西班牙语, 荷兰语, 文本标注, 语言学, BERT 数据概述:... -
孟加拉语语音转录词汇数据集BanglaSpeechTranscriptionVocabulary-tanbeerjubaer
孟加拉语语音转录词汇数据集BanglaSpeechTranscriptionVocabulary-tanbeerjubaer 数据来源:互联网公开数据 标签:语音识别, 语音转录, 孟加拉语, 国际音标, 语言学, 词汇, 数据集, 自然语言处理 数据概述: 该数据集包含来自tanbeerjubaer-dataverse-... -
英语-泰卢固语平行语料库数据集English-TeluguParallelCorpus-adityaaluri
英语-泰卢固语平行语料库数据集English-TeluguParallelCorpus-adityaaluri 数据来源:互联网公开数据 标签:机器翻译, 语料库, 语言学, 英语, 泰卢固语, 自然语言处理, 双语对照, 数据集 数据概述:... -
言语流畅度评估语音数据集SpeechFluencyEvaluationDataset-mitulgargsam
言语流畅度评估语音数据集SpeechFluencyEvaluationDataset-mitulgargsam 数据来源:互联网公开数据 标签:语音识别, 言语流畅度, 口吃, 语音分析, 医学研究, 语言学, 文本标注, 声音特征 数据概述: 该数据集包含来自FluencyBank项目的数据,记录了关于言语流畅度评估的语音数据。主要特征如下:... -
英汉平行语料翻译数据集English-ChineseParallelCorpusTranslation-trid4012
英汉平行语料翻译数据集English-ChineseParallelCorpusTranslation-trid4012 数据来源:互联网公开数据 标签:机器翻译, 语料库, 文本对齐, 双语对照, 语言学, 自然语言处理, 翻译质量评估, 文本分析 数据概述: 该数据集包含英汉双语平行语料,记录了英文句子及其对应的中文翻译。主要特征如下:... -
波斯语蕴含关系文本数据集FarsTailTextualEntailmentDataset-hadibabalou
波斯语蕴含关系文本数据集FarsTailTextualEntailmentDataset-hadibabalou 数据来源:互联网公开数据 标签:文本蕴含, 自然语言处理, 波斯语, 语义推理, 文本分类, 机器翻译, 数据集构建, 语言学 数据概述: 该数据集包含波斯语文本蕴含关系数据,用于训练和评估文本蕴含模型。主要特征如下:... -
多语言翻译文本数据集MultilingualTranslationTextDataset-bolinz
多语言翻译文本数据集MultilingualTranslationTextDataset-bolinz 数据来源:互联网公开数据 标签:机器翻译, 文本翻译, 多语言, 语料库, 语言学, 自然语言处理, 文本分析, 语言对 数据概述: 该数据集包含多种语言的翻译文本对,旨在支持机器翻译模型的训练和评估。主要特征如下:... -
表情符号多语言对照数据集EmojiMultilingualCorrespondenceDataset-hamidehh
表情符号多语言对照数据集EmojiMultilingualCorrespondenceDataset-hamidehh 数据来源:互联网公开数据 标签:表情符号, 文本分析, 多语言, 情感分析, 数据挖掘, 语言学, 自然语言处理, 符号学 数据概述: 该数据集包含来自hamidehh-... -
多语言自然语言推理训练数据集MultilingualNaturalLanguageInferenceTrainingDataset-renadashraf
多语言自然语言推理训练数据集MultilingualNaturalLanguageInferenceTrainingDataset-renadashraf 数据来源:互联网公开数据 标签:自然语言推理, 文本蕴含, 多语言, 文本匹配, 机器翻译, 情感分析, 语义理解, 语言学 数据概述:... -
孟加拉语语音区域方言数据集BanglaSpeechRegionalDialectDataset-raiyanzannat
孟加拉语语音区域方言数据集BanglaSpeechRegionalDialectDataset-raiyanzannat 数据来源:互联网公开数据 标签:语音识别, 孟加拉语, 方言, 语音数据, 文本转录, 自然语言处理, 语言学, 区域方言 数据概述: 该数据集包含来自孟加拉的不同地区的孟加拉语语音数据,记录了孟加拉语的区域方言。主要特征如下:... -
语音训练与用户行为分析数据集SpeechTrainingandUserBehaviorAnalysisDataset-felicianorn
语音训练与用户行为分析数据集SpeechTrainingandUserBehaviorAnalysisDataset-felicianorn 数据来源:互联网公开数据 标签:语音识别, 用户行为, 语音数据, 文本标注, 机器学习, 数据分析, 医疗健康, 语言学 数据概述: 该数据集包含来自Felicianorn Proyecto... -
阿姆哈拉语情感分析数据集AmharicLanguageEmotionAnalysisDataset-rookiejing
阿姆哈拉语情感分析数据集AmharicLanguageEmotionAnalysisDataset-rookiejing 数据来源:互联网公开数据 标签:情感分析, 阿姆哈拉语, 文本分类, 多标签分类, 情绪识别, 语言学, 机器学习, 自然语言处理 数据概述: 该数据集包含来自互联网的阿姆哈拉语文本,并标注了相应的情感类别。主要特征如下:... -
英法平行语料翻译数据集English-FrenchParallelCorpusforMachineTranslation-faouzimohamed
英法平行语料翻译数据集English-FrenchParallelCorpusforMachineTranslation-faouzimohamed 数据来源:互联网公开数据 标签:机器翻译, 语料库, 英法翻译, 自然语言处理, 文本对齐, 语言学, 句子级翻译, 跨语言 数据概述:... -
菲律宾宿务语DaddyBen系列文本数据集CebuanoDaddyBenTextCorpus-benzajtil
菲律宾宿务语DaddyBen系列文本数据集CebuanoDaddyBenTextCorpus-benzajtil 数据来源:互联网公开数据 标签:宿务语, 文本语料库, 方言, 语言学, 文本分析, 文化研究, 对话文本, 语言资源 数据概述: 该数据集包含来自菲律宾宿务语(Cebuano)的Daddy... -
泰米尔语仇恨言论检测数据集TamilHateSpeechDetectionDataset-shantanupatankar
泰米尔语仇恨言论检测数据集TamilHateSpeechDetectionDataset-shantanupatankar 数据来源:互联网公开数据 标签:仇恨言论, 泰米尔语, 文本分类, 情感分析, 社交媒体, 语言学, 数据标注, 机器学习 数据概述:... -
乌尔都语文本情感分类数据集UrduTextSentimentClassificationDataset-maazasad
乌尔都语文本情感分类数据集UrduTextSentimentClassificationDataset-maazasad 数据来源:互联网公开数据 标签:情感分析, 文本分类, 乌尔都语, 仇恨言论检测, 情感极性, 语言学, 机器学习, 自然语言处理 数据概述:...