-
西班牙语评论文本数据集SpanishCommentsTextCorpus-fernandobordi
西班牙语评论文本数据集SpanishCommentsTextCorpus-fernandobordi 数据来源:互联网公开数据 标签:文本分析, 西班牙语, 评论数据, 情感分析, 自然语言处理, 语料库, 文本挖掘, 语言学 数据概述: 该数据集包含来自公开渠道的西班牙语评论文本,记录了用户对不同主题的评论内容。主要特征如下:... -
英语-泰卢固语平行语料翻译数据集English-TeluguParallelCorpus-krizzna69
英语-泰卢固语平行语料翻译数据集English-TeluguParallelCorpus-krizzna69 数据来源:互联网公开数据 标签:机器翻译, 语料库, 语言学, 文本翻译, 英语, 泰卢固语, 自然语言处理, 平行语料 数据概述: 该数据集包含英语与泰卢固语的平行文本,记录了两种语言之间的翻译对应关系。主要特征如下:... -
多语言数字词汇对照数据集MultilingualNumberVocabularyDataset-shubhamprakash778
多语言数字词汇对照数据集MultilingualNumberVocabularyDataset-shubhamprakash778 数据来源:互联网公开数据 标签:多语言, 数字, 词汇对照, 语言学, 文本分析, 印度语系, 词典, 语言学习 数据概述:... -
西班牙语文本词性标注数据集SpanishTextPart-of-SpeechTaggingDataset-libardolopezdiaz
西班牙语文本词性标注数据集SpanishTextPart-of-SpeechTaggingDataset-libardolopezdiaz 数据来源:互联网公开数据 标签:词性标注, 自然语言处理, 西班牙语, 文本分析, 语言学, 语料库, 文本语料, 机器学习 数据概述:... -
努佩语古兰经翻译数据集NupeQuranTranslationDataset-davidvictor297
努佩语古兰经翻译数据集NupeQuranTranslationDataset-davidvictor297 数据来源:互联网公开数据 标签:努佩语, 古兰经, 翻译, 语言学, 文本分析, 跨语言, 宗教, 语义分析 数据概述: 该数据集包含古兰经的英文和努佩语(Nupe)翻译,记录了古兰经经文的跨语言对照。主要特征如下:... -
乌尔都语评论情感分析数据集UrduReviewsSentimentAnalysisDataset-favadhassanjaskani
乌尔都语评论情感分析数据集UrduReviewsSentimentAnalysisDataset-favadhassanjaskani 数据来源:互联网公开数据 标签:情感分析,乌尔都语,文本分类,自然语言处理,情感标注,评论数据,机器学习,语言学 数据概述:... -
多语言文本蕴含关系数据集MultilingualTextualEntailmentDataset-tylermeier
多语言文本蕴含关系数据集MultilingualTextualEntailmentDataset-tylermeier 数据来源:互联网公开数据 标签:文本蕴含, 自然语言推理, 多语言, 机器翻译, 情感分析, 文本匹配, 语言学, 深度学习 数据概述: 该数据集包含来自tylermeier-... -
尼日利亚努佩语单语语料库数据集NupeMonolingualCorpus-davidvictor297
尼日利亚努佩语单语语料库数据集NupeMonolingualCorpus-davidvictor297 数据来源:互联网公开数据 标签:语言学, 语料库, 努佩语, 自然语言处理, 文本分析, 语言资源, 文本语料, 尼日利亚 数据概述:... -
阿姆哈拉语情感分析文本数据集AmharicSentimentAnalysisTextDataset-azzaal
阿姆哈拉语情感分析文本数据集AmharicSentimentAnalysisTextDataset-azzaal 数据来源:互联网公开数据 标签:情感分析, 阿姆哈拉语, 文本分类, 自然语言处理, 语言学, 机器学习, 语料库, 情感极性 数据概述:... -
机器翻译质量评估文本数据集MachineTranslationQualityAssessmentTextDataset-valeriiamoiseeva
机器翻译质量评估文本数据集MachineTranslationQualityAssessmentTextDataset-valeriiamoiseeva 数据来源:互联网公开数据 标签:机器翻译, 文本评估, 翻译质量, 文本分析, 语言学, 自然语言处理, 评估指标, 对比分析 数据概述:... -
泰米尔语文本翻译数据集TamilLanguageTranslationDataset-rnaveenprakash
泰米尔语文本翻译数据集TamilLanguageTranslationDataset-rnaveenprakash 数据来源:互联网公开数据 标签:泰米尔语, 机器翻译, 文本翻译, 语言模型, 自然语言处理, 数据集构建, 语言学, 语料库 数据概述: 该数据集包含泰米尔语文本及其对应的翻译,旨在用于训练和评估机器翻译模型。主要特征如下:... -
曼西语-俄语互译文本数据集Mansi-RussianParallelText-abrosimovkirill
曼西语-俄语互译文本数据集Mansi-RussianParallelText-abrosimovkirill 数据来源:互联网公开数据 标签:机器翻译, 语言学, 文本数据, 语言对, 曼西语, 俄语, 语料库, 自然语言处理 数据概述: 该数据集包含曼西语和俄语的双语平行文本,旨在为机器翻译、语言研究等领域提供数据支持。主要特征如下:... -
英语文本纠错平行语料数据集EnglishTextCorrectionParallelCorpus-rookiejing
英语文本纠错平行语料数据集EnglishTextCorrectionParallelCorpus-rookiejing 数据来源:互联网公开数据 标签:文本纠错, 机器翻译, 语言学, 自然语言处理, 文本匹配, 语料库, 数据清洗, 英语学习 数据概述:... -
米佐语新闻文本分类数据集MizoNewsTextClassificationDataset-robzchhangte
米佐语新闻文本分类数据集MizoNewsTextClassificationDataset-robzchhangte 数据来源:互联网公开数据 标签:文本分类, 新闻分析, 米佐语, 自然语言处理, 语言学, 机器学习, 情感分析, 语料库 数据概述: 该数据集包含来自互联网的米佐语新闻文章,记录了不同主题的新闻内容,用于文本分类任务。主要特征如下:... -
孟加拉语语音转录地名数据集BengaliSpeechTranscriptionLocationData-jahid24
孟加拉语语音转录地名数据集BengaliSpeechTranscriptionLocationData-jahid24 数据来源:互联网公开数据 标签:语音识别, 孟加拉语, 语音转录, 地理位置, 数据标注, 语音数据, 语言学, 机器学习 数据概述: 该数据集包含来自孟加拉地区的孟加拉语语音转录数据,记录了不同地点的语音转录文本。主要特征如下:... -
南非国家文化与语言技术委员会NCLT斯瓦希里语料库元数据数据集NCLTSwahiliCorpusMetadata-rewardmathebula
南非国家文化与语言技术委员会NCLT斯瓦希里语料库元数据数据集NCLTSwahiliCorpusMetadata-rewardmathebula 数据来源:互联网公开数据 标签:斯瓦希里语, 语料库, 元数据, 语言学, 文本分析, 语言资源, 南非, 自然语言处理 数据概述:... -
约鲁巴语-英语翻译数据集Yoruba-EnglishTranslationDataset-mohamedhelmiklai
约鲁巴语-英语翻译数据集Yoruba-EnglishTranslationDataset-mohamedhelmiklai 数据来源:互联网公开数据 标签:机器翻译, 约鲁巴语, 英语, 语言学, 文本翻译, 自然语言处理, 双语对照, 语料库 数据概述:... -
阿萨姆语语音转录数据集AssameseSpeechTranscriptionDataset-hemantasarma
阿萨姆语语音转录数据集AssameseSpeechTranscriptionDataset-hemantasarma 数据来源:互联网公开数据 标签:语音识别, 阿萨姆语, 语音转录, 语言学, 语音合成, 文本分析, 声音数据, 数据标注 数据概述:... -
孟加拉语文本与国际音标对照数据集BengaliTextandIPADataset-mushfiqurrahmangalib
孟加拉语文本与国际音标对照数据集BengaliTextandIPADataset-mushfiqurrahmangalib 数据来源:互联网公开数据 标签:孟加拉语, 语音学, 语言学, 国际音标, 文本转录, 自然语言处理, 数据集, 语音识别 数据概述:... -
俄语笑话文本数据集RussianJokesTextDataset-mapatb22205
俄语笑话文本数据集RussianJokesTextDataset-mapatb22205 数据来源:互联网公开数据 标签:俄语, 笑话, 文本, 自然语言处理, 语料库, 文本分析, 情感分析, 语言学 数据概述: 该数据集包含来自互联网的俄语笑话文本,记录了各种类型的俄语笑话。主要特征如下: 时间跨度:数据未标明具体时间,视作静态语料数据集使用。...