-
塔马舍克语音频数据集TamasheqAudioDataset-adeldafi
塔马舍克语音频数据集TamasheqAudioDataset-adeldafi 数据来源:互联网公开数据 标签:塔马舍克语, 音频数据, 语言学, 语音识别, 语音分析, 文化研究, 声音样本, 语音语料库 数据概述: 该数据集包含来自 Adeldafi 的塔马舍克语音频文件,记录了塔马舍克语的语音样本。主要特征如下:... -
英法翻译语句对照数据集English-FrenchTranslationSentenceDataset-mansikasahoo2
英法翻译语句对照数据集English-FrenchTranslationSentenceDataset-mansikasahoo2 数据来源:互联网公开数据 标签:机器翻译, 语言学, 英法翻译, 文本数据, 自然语言处理, 语料库, 双语对照, 文本分析 数据概述: 该数据集包含英法双语的句子对照数据,记录了英语语句及其对应的法语翻译。主要特征如下:... -
印度地区音频转录文本数据集IndiaRegionalAudioTranscriptionText-pranav51286
印度地区音频转录文本数据集IndiaRegionalAudioTranscriptionText-pranav51286 数据来源:互联网公开数据 标签:音频转录, 语音识别, 印度, 印地语, 文本分析, 自然语言处理, 语料库, 语言学 数据概述: 该数据集包含来自印度地区的音频转录文本,记录了印地语的语音内容及其对应的文字转录。主要特征如下:... -
网络俚语词汇释义数据集InternetSlangDictionary-hc1122
网络俚语词汇释义数据集InternetSlangDictionary-hc1122 数据来源:互联网公开数据 标签:俚语, 网络用语, 词典, 文本分析, 语言学, 语义分析, 社交媒体, 数据挖掘 数据概述: 该数据集包含来自互联网的俚语词汇及其对应的释义,记录了常用网络流行语的含义。主要特征如下:... -
孟加拉语语音文本地域分类数据集BanglaSpeechRegionalClassificationDataset-raiyanzannat
孟加拉语语音文本地域分类数据集BanglaSpeechRegionalClassificationDataset-raiyanzannat 数据来源:互联网公开数据 标签:语音识别, 文本分类, 孟加拉语, 地域分类, 语言学, 自然语言处理, 语音数据, 机器学习 数据概述:... -
多语言仇恨言论检测数据集MultilingualHateSpeechDetectionDataset-ruhinatabasshum
多语言仇恨言论检测数据集MultilingualHateSpeechDetectionDataset-ruhinatabasshum 数据来源:互联网公开数据 标签:仇恨言论, 文本分类, 多语言, 情感分析, 机器翻译, 数据标注, 语言学, 自然语言处理 数据概述:... -
多语言平行文本翻译数据集MultilingualParallelTextTranslationDataset-rookiejing
多语言平行文本翻译数据集MultilingualParallelTextTranslationDataset-rookiejing 数据来源:互联网公开数据 标签:机器翻译, 文本对齐, 多语言, 英语, 阿姆哈拉语, 马拉地语, 泰卢固语, 语料库, 自然语言处理, 语言学 数据概述:... -
图像文字混合泰语数据集ImageTextHybridThaiDataset-arisapim
图像文字混合泰语数据集ImageTextHybridThaiDataset-arisapim 数据来源:互联网公开数据 标签:图像识别,光学字符识别,泰语,文本分析,多模态数据,语言学,机器学习,文字识别 数据概述: 该数据集包含图像和泰语文本的混合数据,旨在用于图像中泰语文字的识别与分析。主要特征如下:... -
英语-泰米尔语翻译数据集English-TamilTranslationDataset-kamal2026
英语-泰米尔语翻译数据集English-TamilTranslationDataset-kamal2026 数据来源:互联网公开数据 标签:机器翻译, 语言学, 泰米尔语, 英语, 文本翻译, 自然语言处理, 双语对照, 语料库 数据概述: 该数据集包含英语与泰米尔语的翻译对照,旨在为机器翻译模型提供训练数据。主要特征如下:... -
印度总理-曼德-基-巴特-广播节目文本数据集IndianPrimeMinisterMannKiBaatBroadcastText-alphamuth
印度总理-曼德-基-巴特-广播节目文本数据集IndianPrimeMinisterMannKiBaatBroadcastText-alphamuth 数据来源:互联网公开数据 标签:政治, 广播, 文本分析, 印度, 公共演讲, 语料库, 社交媒体, 语言学 数据概述: 该数据集包含印度总理“曼德·基·巴特”(Mann Ki... -
印地语-英语-Hinglish三语翻译数据集Hindi-English-HinglishTri-lingualTranslationDataset-sau...
印地语-英语-Hinglish三语翻译数据集Hindi-English-HinglishTri-lingualTranslationDataset-saumyamishra536 数据来源:互联网公开数据 标签:机器翻译, 文本翻译, 语言学, 印地语, 英语, Hinglish, 多语言, 自然语言处理 数据概述:... -
阿拉伯语机器学习与技术术语对照数据集ArabicMachineLearningandTechnologyTerminology-ahmedhassanibrahim
阿拉伯语机器学习与技术术语对照数据集ArabicMachineLearningandTechnologyTerminology-ahmedhassanibrahim 数据来源:互联网公开数据 标签:阿拉伯语, 机器学习, 人工智能, 技术术语, 术语翻译, 自然语言处理, 语言学, 术语对照 数据概述:... -
泰米尔语仇恨言论检测数据集TamilHateSpeechDetection-malligasenthil
泰米尔语仇恨言论检测数据集TamilHateSpeechDetection-malligasenthil 数据来源:互联网公开数据 标签:仇恨言论, 泰米尔语, 文本分类, 情感分析, 恶意内容检测, 语言学, 机器学习, 数据标注 数据概述: 该数据集包含来自社交媒体及其他公开渠道的泰米尔语文本,记录了用于识别仇恨言论的文本示例。主要特征如下:... -
波斯语语音识别数据集PersianSpeechRecognitionDataset-melikasaadi
波斯语语音识别数据集PersianSpeechRecognitionDataset-melikasaadi 数据来源:互联网公开数据 标签:语音识别, 波斯语, 语音数据, 声学模型, 语言学, 深度学习, 语音转录, 语音合成 数据概述: 该数据集包含波斯语语音数据及其对应的文本转录,旨在用于语音识别模型的训练和评估。主要特征如下:... -
阿拉伯语情感分析文本数据集ArabicSentimentAnalysisTextDataset-colabdscience
阿拉伯语情感分析文本数据集ArabicSentimentAnalysisTextDataset-colabdscience 数据来源:互联网公开数据 标签:情感分析, 阿拉伯语, 文本分类, 自然语言处理, 情感标注, 机器学习, 语料库, 语言学 数据概述:... -
印地语语音转录数据集HindiSpeechTranscriptionDataset-sarty077
印地语语音转录数据集HindiSpeechTranscriptionDataset-sarty077 数据来源:互联网公开数据 标签:语音识别, 语音转录, 印地语, 文本数据, 声学模型, 自然语言处理, 语言学, 语音合成 数据概述: 该数据集包含印地语语音文件及其对应的文本转录。主要特征如下:... -
西班牙语文本元音辅音分类数据集SpanishTextVowelConsonantClassification-asunmayoral
西班牙语文本元音辅音分类数据集SpanishTextVowelConsonantClassification-asunmayoral 数据来源:互联网公开数据 标签:文本分类, 西班牙语, 语言学, 元音, 辅音, 自然语言处理, 字符识别, 数据标注 数据概述: 该数据集包含西班牙语文本字符数据,记录了字符的元音或辅音属性。主要特征如下:... -
希腊语新约圣经文本数据集NewTestamentGreekTextDataset-nikosraftogiannis
希腊语新约圣经文本数据集NewTestamentGreekTextDataset-nikosraftogiannis 数据来源:互联网公开数据 标签:圣经, 希腊语, 文本分析, 语言学, 语料库, 宗教, 文本挖掘, 古希腊语 数据概述: 该数据集包含来自希腊语新约圣经的文本数据,记录了新约圣经各书卷的希腊语原文。主要特征如下:... -
英语语音文本情感分析数据集EnglishSpeechTextSentimentAnalysis-nikhil9999
英语语音文本情感分析数据集EnglishSpeechTextSentimentAnalysis-nikhil9999 数据来源:互联网公开数据 标签:语音识别, 情感分析, 文本分析, 语音数据, 语言学, 机器学习, 标注数据, 自然语言处理 数据概述: 该数据集包含来自Common... -
西班牙语语音转录数据集SpanishSpeechTranscriptionDataset-raaad3000
西班牙语语音转录数据集SpanishSpeechTranscriptionDataset-raaad3000 数据来源:互联网公开数据 标签:语音识别, 西班牙语, 语音转录, 语言学, 声学模型, 文本分析, 语音数据, 机器学习 数据概述: 该数据集包含来自公开渠道的西班牙语语音数据,记录了语音文件与其对应的文本转录。主要特征如下:...