-
表情符号多语言对照数据集EmojiMultilingualCorrespondenceDataset-hamidehh
表情符号多语言对照数据集EmojiMultilingualCorrespondenceDataset-hamidehh 数据来源:互联网公开数据 标签:表情符号, 文本分析, 多语言, 情感分析, 数据挖掘, 语言学, 自然语言处理, 符号学 数据概述: 该数据集包含来自hamidehh-... -
多语言自然语言推理训练数据集MultilingualNaturalLanguageInferenceTrainingDataset-renadashraf
多语言自然语言推理训练数据集MultilingualNaturalLanguageInferenceTrainingDataset-renadashraf 数据来源:互联网公开数据 标签:自然语言推理, 文本蕴含, 多语言, 文本匹配, 机器翻译, 情感分析, 语义理解, 语言学 数据概述:... -
孟加拉语语音区域方言数据集BanglaSpeechRegionalDialectDataset-raiyanzannat
孟加拉语语音区域方言数据集BanglaSpeechRegionalDialectDataset-raiyanzannat 数据来源:互联网公开数据 标签:语音识别, 孟加拉语, 方言, 语音数据, 文本转录, 自然语言处理, 语言学, 区域方言 数据概述: 该数据集包含来自孟加拉的不同地区的孟加拉语语音数据,记录了孟加拉语的区域方言。主要特征如下:... -
语音训练与用户行为分析数据集SpeechTrainingandUserBehaviorAnalysisDataset-felicianorn
语音训练与用户行为分析数据集SpeechTrainingandUserBehaviorAnalysisDataset-felicianorn 数据来源:互联网公开数据 标签:语音识别, 用户行为, 语音数据, 文本标注, 机器学习, 数据分析, 医疗健康, 语言学 数据概述: 该数据集包含来自Felicianorn Proyecto... -
阿姆哈拉语情感分析数据集AmharicLanguageEmotionAnalysisDataset-rookiejing
阿姆哈拉语情感分析数据集AmharicLanguageEmotionAnalysisDataset-rookiejing 数据来源:互联网公开数据 标签:情感分析, 阿姆哈拉语, 文本分类, 多标签分类, 情绪识别, 语言学, 机器学习, 自然语言处理 数据概述: 该数据集包含来自互联网的阿姆哈拉语文本,并标注了相应的情感类别。主要特征如下:... -
英法平行语料翻译数据集English-FrenchParallelCorpusforMachineTranslation-faouzimohamed
英法平行语料翻译数据集English-FrenchParallelCorpusforMachineTranslation-faouzimohamed 数据来源:互联网公开数据 标签:机器翻译, 语料库, 英法翻译, 自然语言处理, 文本对齐, 语言学, 句子级翻译, 跨语言 数据概述:... -
菲律宾宿务语DaddyBen系列文本数据集CebuanoDaddyBenTextCorpus-benzajtil
菲律宾宿务语DaddyBen系列文本数据集CebuanoDaddyBenTextCorpus-benzajtil 数据来源:互联网公开数据 标签:宿务语, 文本语料库, 方言, 语言学, 文本分析, 文化研究, 对话文本, 语言资源 数据概述: 该数据集包含来自菲律宾宿务语(Cebuano)的Daddy... -
泰米尔语仇恨言论检测数据集TamilHateSpeechDetectionDataset-shantanupatankar
泰米尔语仇恨言论检测数据集TamilHateSpeechDetectionDataset-shantanupatankar 数据来源:互联网公开数据 标签:仇恨言论, 泰米尔语, 文本分类, 情感分析, 社交媒体, 语言学, 数据标注, 机器学习 数据概述:... -
乌尔都语文本情感分类数据集UrduTextSentimentClassificationDataset-maazasad
乌尔都语文本情感分类数据集UrduTextSentimentClassificationDataset-maazasad 数据来源:互联网公开数据 标签:情感分析, 文本分类, 乌尔都语, 仇恨言论检测, 情感极性, 语言学, 机器学习, 自然语言处理 数据概述:... -
孟加拉语地区文本分类数据集BengaliRegionTextClassificationDataset-safayetrafi
孟加拉语地区文本分类数据集BengaliRegionTextClassificationDataset-safayetrafi 数据来源:互联网公开数据 标签:文本分类, 孟加拉语, 地理信息, 语言学, 自然语言处理, 多标签分类, 语料库, 情感分析 数据概述: 该数据集包含来自孟加拉地区不同区域的文本内容,旨在用于文本分类任务。主要特征如下:... -
摩洛哥阿拉伯语-英语翻译平行语料数据集MoroccanArabic-EnglishParallelCorpus-akrambel
摩洛哥阿拉伯语-英语翻译平行语料数据集MoroccanArabic-EnglishParallelCorpus-akrambel 数据来源:互联网公开数据 标签:机器翻译, 语言学, 摩洛哥阿拉伯语, 英语, 语料库, 翻译, 自然语言处理, 数据集 数据概述:... -
匈牙利语文本情感分析数据集HungarianTextSentimentAnalysis-manczalmatj
匈牙利语文本情感分析数据集HungarianTextSentimentAnalysis-manczalmatj 数据来源:互联网公开数据 标签:情感分析, 文本分类, 匈牙利语, 自然语言处理, 情感极性, 语言学, 深度学习, 数据标注 数据概述: 该数据集包含来自公开的匈牙利语文本数据,记录了对应文本的情感极性。主要特征如下:... -
多语种词语词性标注数据集MultilingualWordPart-of-SpeechTaggingDataset-khlifimohamed
多语种词语词性标注数据集MultilingualWordPart-of-SpeechTaggingDataset-khlifimohamed 数据来源:互联网公开数据 标签:词性标注, 自然语言处理, 多语言, 文本分析, 语言学, 语料库, 机器学习, 词语 数据概述:... -
卡纳达语语音转录数据集KannadaSpeechTranscriptionDataset-lokotwist
卡纳达语语音转录数据集KannadaSpeechTranscriptionDataset-lokotwist 数据来源:互联网公开数据 标签:语音识别, 语音转录, 卡纳达语, 语音数据集, 深度学习, 声学模型, 语言学, FLEURS 数据概述: 该数据集包含来自FLEURS项目(Few-shot Learning Evaluation of... -
阿拉伯语姓名与出生信息数据集ArabicNamesandBirthInformation-abdalazez
阿拉伯语姓名与出生信息数据集ArabicNamesandBirthInformation-abdalazez 数据来源:互联网公开数据 标签:阿拉伯语, 姓名, 出生信息, 人口统计, 语言学, 数据清洗, 文本分析, 数据库 数据概述: 该数据集包含来自公开渠道的阿拉伯语姓名与相关出生信息。主要特征如下:... -
印尼语文本语料库数据集IndonesianTextCorpus-nandaerwinsyah
印尼语文本语料库数据集IndonesianTextCorpus-nandaerwinsyah 数据来源:互联网公开数据 标签:印尼语, 文本语料库, 自然语言处理, 文本分析, 语言学, 语料库构建, 文本挖掘, 语言模型 数据概述: 该数据集包含来自印尼语文本语料库的数据,记录了印尼语的句子示例。主要特征如下:... -
古兰经经文英阿对照文本数据集QuranicVersesEnglish-ArabicParallelCorpus-mohamedwaelbishr2018
古兰经经文英阿对照文本数据集QuranicVersesEnglish-ArabicParallelCorpus-mohamedwaelbishr2018 数据来源:互联网公开数据 标签:古兰经, 阿拉伯语, 英语翻译, 文本数据, 宗教, 语言学, 语料库, 自然语言处理 数据概述:... -
阿拉伯语文本相似度分析数据集ArabicTextSimilarityAnalysis-elemam
阿拉伯语文本相似度分析数据集ArabicTextSimilarityAnalysis-elemam 数据来源:互联网公开数据 标签:文本相似度, 阿拉伯语, 自然语言处理, 语义分析, 文本匹配, 机器翻译, 语料库, 语言学 数据概述: 该数据集包含阿拉伯语文本对,用于评估和分析文本之间的相似度。主要特征如下:... -
印地语-英语混合语料翻译数据集Hindi-EnglishHinglishTranslationDataset-louistom
印地语-英语混合语料翻译数据集Hindi-EnglishHinglishTranslationDataset-louistom 数据来源:互联网公开数据 标签:机器翻译, 语言学, 印度语, 英语, 混合语言, 语料库, 自然语言处理, 多语言 数据概述: 该数据集包含来自互联网的印地语-英语混合语料,记录了英语、印地语以及Hinglish(印地语-... -
英文文本词对齐数据集EnglishTextWordAlignmentDataset-nairsaanvi
英文文本词对齐数据集EnglishTextWordAlignmentDataset-nairsaanvi 数据来源:互联网公开数据 标签:词对齐, 自然语言处理, 文本分析, 语料库, 机器翻译, 文本处理, 数据标注, 语言学 数据概述: 该数据集包含来自不同来源的英文文本数据,记录了词级别的对齐信息,主要用于研究和开发词对齐模型。主要特征如下:...