-
孟加拉语地区文本分类数据集BengaliRegionTextClassificationDataset-safayetrafi
孟加拉语地区文本分类数据集BengaliRegionTextClassificationDataset-safayetrafi 数据来源:互联网公开数据 标签:文本分类, 孟加拉语, 地理信息, 语言学, 自然语言处理, 多标签分类, 语料库, 情感分析 数据概述: 该数据集包含来自孟加拉地区不同区域的文本内容,旨在用于文本分类任务。主要特征如下:... -
摩洛哥阿拉伯语-英语翻译平行语料数据集MoroccanArabic-EnglishParallelCorpus-akrambel
摩洛哥阿拉伯语-英语翻译平行语料数据集MoroccanArabic-EnglishParallelCorpus-akrambel 数据来源:互联网公开数据 标签:机器翻译, 语言学, 摩洛哥阿拉伯语, 英语, 语料库, 翻译, 自然语言处理, 数据集 数据概述:... -
匈牙利语文本情感分析数据集HungarianTextSentimentAnalysis-manczalmatj
匈牙利语文本情感分析数据集HungarianTextSentimentAnalysis-manczalmatj 数据来源:互联网公开数据 标签:情感分析, 文本分类, 匈牙利语, 自然语言处理, 情感极性, 语言学, 深度学习, 数据标注 数据概述: 该数据集包含来自公开的匈牙利语文本数据,记录了对应文本的情感极性。主要特征如下:... -
多语种词语词性标注数据集MultilingualWordPart-of-SpeechTaggingDataset-khlifimohamed
多语种词语词性标注数据集MultilingualWordPart-of-SpeechTaggingDataset-khlifimohamed 数据来源:互联网公开数据 标签:词性标注, 自然语言处理, 多语言, 文本分析, 语言学, 语料库, 机器学习, 词语 数据概述:... -
卡纳达语语音转录数据集KannadaSpeechTranscriptionDataset-lokotwist
卡纳达语语音转录数据集KannadaSpeechTranscriptionDataset-lokotwist 数据来源:互联网公开数据 标签:语音识别, 语音转录, 卡纳达语, 语音数据集, 深度学习, 声学模型, 语言学, FLEURS 数据概述: 该数据集包含来自FLEURS项目(Few-shot Learning Evaluation of... -
阿拉伯语姓名与出生信息数据集ArabicNamesandBirthInformation-abdalazez
阿拉伯语姓名与出生信息数据集ArabicNamesandBirthInformation-abdalazez 数据来源:互联网公开数据 标签:阿拉伯语, 姓名, 出生信息, 人口统计, 语言学, 数据清洗, 文本分析, 数据库 数据概述: 该数据集包含来自公开渠道的阿拉伯语姓名与相关出生信息。主要特征如下:... -
印尼语文本语料库数据集IndonesianTextCorpus-nandaerwinsyah
印尼语文本语料库数据集IndonesianTextCorpus-nandaerwinsyah 数据来源:互联网公开数据 标签:印尼语, 文本语料库, 自然语言处理, 文本分析, 语言学, 语料库构建, 文本挖掘, 语言模型 数据概述: 该数据集包含来自印尼语文本语料库的数据,记录了印尼语的句子示例。主要特征如下:... -
古兰经经文英阿对照文本数据集QuranicVersesEnglish-ArabicParallelCorpus-mohamedwaelbishr2018
古兰经经文英阿对照文本数据集QuranicVersesEnglish-ArabicParallelCorpus-mohamedwaelbishr2018 数据来源:互联网公开数据 标签:古兰经, 阿拉伯语, 英语翻译, 文本数据, 宗教, 语言学, 语料库, 自然语言处理 数据概述:... -
阿拉伯语文本相似度分析数据集ArabicTextSimilarityAnalysis-elemam
阿拉伯语文本相似度分析数据集ArabicTextSimilarityAnalysis-elemam 数据来源:互联网公开数据 标签:文本相似度, 阿拉伯语, 自然语言处理, 语义分析, 文本匹配, 机器翻译, 语料库, 语言学 数据概述: 该数据集包含阿拉伯语文本对,用于评估和分析文本之间的相似度。主要特征如下:... -
印地语-英语混合语料翻译数据集Hindi-EnglishHinglishTranslationDataset-louistom
印地语-英语混合语料翻译数据集Hindi-EnglishHinglishTranslationDataset-louistom 数据来源:互联网公开数据 标签:机器翻译, 语言学, 印度语, 英语, 混合语言, 语料库, 自然语言处理, 多语言 数据概述: 该数据集包含来自互联网的印地语-英语混合语料,记录了英语、印地语以及Hinglish(印地语-... -
英文文本词对齐数据集EnglishTextWordAlignmentDataset-nairsaanvi
英文文本词对齐数据集EnglishTextWordAlignmentDataset-nairsaanvi 数据来源:互联网公开数据 标签:词对齐, 自然语言处理, 文本分析, 语料库, 机器翻译, 文本处理, 数据标注, 语言学 数据概述: 该数据集包含来自不同来源的英文文本数据,记录了词级别的对齐信息,主要用于研究和开发词对齐模型。主要特征如下:... -
印尼语文本分类语料库数据集IndonesianTextClassificationCorpus-hyadukuoningroqal
印尼语文本分类语料库数据集IndonesianTextClassificationCorpus-hyadukuoningroqal 数据来源:互联网公开数据 标签:文本分类, 印尼语, 语料库, 语言学, 自然语言处理, 文本分析, 情感分析, 机器学习 数据概述: 该数据集包含来自印尼语文本的数据,记录了用于文本分类任务的句子样本。主要特征如下:... -
仇恨言论检测文本数据集HateSpeechDetectionTextDataset-amitdasrup
仇恨言论检测文本数据集HateSpeechDetectionTextDataset-amitdasrup 数据来源:互联网公开数据 标签:仇恨言论, 文本分类, 情感分析, 自然语言处理, 标注数据, 机器学习, 社交媒体, 语言学 数据概述: 该数据集包含来自社交媒体平台的文本数据,记录了带有仇恨言论倾向的文本样本,以及相关的标注信息。主要特征如下:... -
孟加拉语语音转录数据集BanglatoIPA-jakir57
孟加拉语语音转录数据集BanglatoIPA-jakir57 数据来源:互联网公开数据 标签:语音识别, 语音转录, 孟加拉语, 国际音标, 语言学, 文本处理, 机器翻译, 语音合成 数据概述: 该数据集包含孟加拉语文本及其对应的国际音标(IPA)转录,旨在支持孟加拉语语音相关的研究与应用。主要特征如下:... -
社交媒体俚语缩写释义数据集SocialMediaSlangAcronymExpansion-puyushgupta
社交媒体俚语缩写释义数据集SocialMediaSlangAcronymExpansion-puyushgupta 数据来源:互联网公开数据 标签:俚语, 缩写, 社交媒体, 文本分析, 自然语言处理, 语料库, 语言学, 数据挖掘 数据概述: 该数据集包含来自社交媒体平台的俚语缩写及其对应的完整释义。主要特征如下:... -
突尼斯阿拉伯语-英语翻译对照数据集TunisianArabic-EnglishTranslationDataset-khawlajlassi
突尼斯阿拉伯语-英语翻译对照数据集TunisianArabic-EnglishTranslationDataset-khawlajlassi 数据来源:互联网公开数据 标签:机器翻译, 语言学, 阿拉伯语, 英语, 文本翻译, 语料库, 自然语言处理, 双语对照 数据概述:... -
越南语情感语音识别数据集VietnameseEmotionalSpeechRecognitionDataset-sontrancao
越南语情感语音识别数据集VietnameseEmotionalSpeechRecognitionDataset-sontrancao 数据来源:互联网公开数据 标签:语音识别, 情感分析, 越南语, 声学模型, 语音情感, 数据标注, 语言学, 机器学习 数据概述:... -
多语言数字对照数据集MultilingualNumberCorrespondenceDataset-shubhamprakash778
多语言数字对照数据集MultilingualNumberCorrespondenceDataset-shubhamprakash778 数据来源:互联网公开数据 标签:多语言, 数字, 语言学, 翻译, 文本分析, 词汇对照, 印度语言, 数据集 数据概述:... -
土耳其语恶意文本分类数据集TurkishOffensiveTextClassificationDataset-alaaddinerdindal
土耳其语恶意文本分类数据集TurkishOffensiveTextClassificationDataset-alaaddinerdindal 数据来源:互联网公开数据 标签:土耳其语, 文本分类, 恶意文本, 冒犯性言论, 情感分析, 语言学, 机器学习, 数据标注 数据概述:... -
土耳其语和意大利语习语识别与评价数据集TurkishandItalianIdiomRecognitionandEvaluationDataset-alisentas
土耳其语和意大利语习语识别与评价数据集TurkishandItalianIdiomRecognitionandEvaluationDataset-alisentas 数据来源:互联网公开数据 标签:习语识别, 文本分析, 语言学, 土耳其语, 意大利语, 情感分析, 评价, 机器学习 数据概述:...