-
方言数据集DialectDataDataset-kitashinwtf
方言数据集DialectDataDataset-kitashinwtf 数据来源:互联网公开数据 标签:方言,语言学,数据集,语音识别,机器学习,自然语言处理,语言研究,文化研究 数据概述: 该数据集包含来自不同地区方言的语音和文本数据,记录了多种方言的发音,词汇和语法特征。主要特征如下: 时间跨度:数据记录的时间范围从近年到现代。... -
阿拉伯语讽刺文本数据集-farisalahmdi
阿拉伯语讽刺文本数据集-farisalahmdi 数据来源:互联网公开数据 标签:阿拉伯语,讽刺,文本分析,自然语言处理,情感分析,语言学,机器学习,社交媒体 数据概述:该数据集包含了阿拉伯语的讽刺文本数据,主要来源于社交媒体平台,新闻网站等。主要特征如下: 时间跨度:数据记录的时间范围跨度不固定,取决于数据来源。... -
拉脱维亚语问答数据集LatvianQuestion-AnswerDataset-valdispterisotais
拉脱维亚语问答数据集LatvianQuestion-AnswerDataset-valdispterisotais 数据来源:互联网公开数据 标签:自然语言处理,问答系统,数据集,拉脱维亚语,文本分析,机器学习,语言学,信息检索 数据概述: 该数据集包含了拉脱维亚语的问答对,旨在促进拉脱维亚语自然语言处理领域的研究和应用。主要特征如下: 时间跨度:... -
印英双语语音翻译数据集SpokenHindiandEnglishTranslationsDataset-sachin1811
印英双语语音翻译数据集SpokenHindiandEnglishTranslationsDataset-sachin1811 数据来源:互联网公开数据 标签:语音识别,自然语言处理,数据集,双语翻译,机器学习,语言学,人工智能,语音合成 数据概述:该数据集包含来自多个来源的印英双语语音数据,记录了日常对话和短语的语音及其对应的英文翻译。主要特征如下:... -
笑话综合数据集CombinedJokesDataset-ihdufxr2024
笑话综合数据集CombinedJokesDataset-ihdufxr2024 数据来源:互联网公开数据 标签:笑话,数据集,自然语言处理,文本分析,娱乐,机器学习,语言学,文化研究 数据概述:该数据集包含来自多个来源的笑话数据,记录了各类笑话的详细信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。... -
语音与演讲数据集VoiceandSpeechDataset-amitabh08
语音与演讲数据集VoiceandSpeechDataset-amitabh08 数据来源:互联网公开数据 标签:语音识别,数据集,语言学,情感分析,人工智能,自然语言处理,机器学习,声音特征 数据概述: 该数据集包含来自公开来源的语音与演讲数据,记录了不同人的语音样本及其相关属性。主要特征如下: 时间跨度:数据记录的时间范围从近年到现代。... -
脱口秀表演脚本数据集Stand-upComedyScriptsDataset-aryagm1
脱口秀表演脚本数据集Stand-upComedyScriptsDataset-aryagm1 数据来源:互联网公开数据 标签:脱口秀,喜剧,文本分析,自然语言处理,数据集,语言学,娱乐,表演艺术 数据概述: 该数据集包含了大量的脱口秀表演脚本,记录了不同喜剧演员的表演内容。主要特征如下: 时间跨度:数据记录的时间范围不定,涵盖了不同年代的脱口秀表演。... -
英西语翻译数据集English-SpanishTranslationDataset-nouranader
英西语翻译数据集English-SpanishTranslationDataset-nouranader 数据来源:互联网公开数据 标签:翻译,语言学,数据集,机器学习,自然语言处理,文本分析,多语言支持,语言学习 数据概述:该数据集包含来自互联网的英西语翻译数据,记录了英语和西班牙语之间的文本对应关系。主要特征如下:... -
英印互译数据集EngHindiDataset-abcdef999
英印互译数据集EngHindiDataset-abcdef999 数据来源:互联网公开数据 标签:机器翻译,数据集,印地语,英语,自然语言处理,文本数据,跨语言,语言学 数据概述: 该数据集包含了英语和印地语的平行语料,即互译的句子对。主要特征如下: 时间跨度:数据记录的时间范围不限,收录了不同时期,不同来源的文本。... -
文本分类数据集WordClassificationDataset-jcatumba
文本分类数据集WordClassificationDataset-jcatumba 数据来源:互联网公开数据 标签:文本分类,自然语言处理,数据集,机器学习,文本分析,人工智能,语言学,数据科学 数据概述:该数据集包含来自多个来源的文本数据,记录了不同类别的文本信息,适用于文本分类任务。主要特征如下:... -
自然语言推理处理数据集ProcessedSNLIDataset-neverseepython
自然语言推理处理数据集ProcessedSNLIDataset-neverseepython 数据来源:互联网公开数据 标签:自然语言处理,数据集,推理任务,机器学习,文本分析,人工智能,语言学,学术资源 数据概述:该数据集包含来自斯坦福自然语言推理(SNLI)项目的处理后的数据,记录了成对句子及它们的逻辑关系,适用于自然语言推理研究。主要特征如下:... -
埃及象形文字标注数据集LabeledEgyptianHieroglyphsDataset-muradcebeci
埃及象形文字标注数据集LabeledEgyptianHieroglyphsDataset-muradcebeci 数据来源:互联网公开数据 标签:埃及象形文字,数据集,图像分析,文化研究,机器学习,视觉识别,学术资源,语言学 数据概述:该数据集包含来自公开资源的埃及象形文字图像及其标注信息,记录了不同象形文字的图像和对应的释义。主要特征如下:... -
印地语到印地语-英迪亚语翻译数据集HinditoHinglishTranslationDataset-parthplc
印地语到印地语-英迪亚语翻译数据集HinditoHinglishTranslationDataset-parthplc 数据来源:互联网公开数据 标签:印地语,印地语-英迪亚语,数据集,自然语言处理,机器翻译,文本分析,语言学,人工智能 数据概述:该数据集包含来自多个来源的印地语到印地语-... -
法语维基百科数据集WikiFrenchDataset-manueldesiretaira
法语维基百科数据集WikiFrenchDataset-manueldesiretaira 数据来源:互联网公开数据 标签:维基百科,法语,数据集,自然语言处理,文本分析,机器学习,语言学,学术资源 数据概述:该数据集包含来自法语维基百科的数据,记录了维基百科中各个条目的内容。主要特征如下: 时间跨度:数据记录的时间范围从2001年到2023年。... -
预训练BERT大型语言模型数据集PreprosBERTLargeDataset-fattahpradiptak
预训练BERT大型语言模型数据集PreprosBERTLargeDataset-fattahpradiptak 数据来源:互联网公开数据 标签:自然语言处理,BERT模型,数据集,机器学习,文本分析,深度学习,语言学,人工智能 数据概述: 该数据集为BERT大型语言模型的预训练数据,主要包含用于训练BERT模型的文本数据。主要特征如下:... -
词义消歧数据集WSDData-abdelrahmanelbakouri
词义消歧数据集WSDData-abdelrahmanelbakouri 数据来源:互联网公开数据 标签:自然语言处理,词义消歧,数据集,语义分析,机器学习,文本分析,语言学,人工智能 数据概述: 该数据集包含了用于词义消歧(Word Sense Disambiguation,... -
孟加拉语句子转换数据集BanglaSentenceTransformationDataset-prinom
孟加拉语句子转换数据集BanglaSentenceTransformationDataset-prinom 数据来源:互联网公开数据 标签:孟加拉语,自然语言处理,句子转换,数据集,文本生成,语言学,机器翻译,文本分析 数据概述: 该数据集包含孟加拉语的句子转换数据,记录了孟加拉语句子在不同语法结构和表达方式下的多种转换形式。主要特征如下:... -
卡纳达语情感分析数据集-kishorsinnur
卡纳达语情感分析数据集-kishorsinnur 数据来源:互联网公开数据 标签:情感分析,卡纳达语,自然语言处理,数据集,文本分类,机器学习,印度语言,语言学 数据概述:该数据集包含来自各种来源的卡纳达语文本数据,用于情感分析任务。主要特征如下: 时间跨度:数据记录的时间范围不明确,但包含了从近期到过去一段时间的文本数据。... -
泰米尔语新闻标题翻译数据集TamilNewsHeadlinesTranslationDataset-abishpius
泰米尔语新闻标题翻译数据集TamilNewsHeadlinesTranslationDataset-abishpius 数据来源:互联网公开数据 标签:泰米尔语,新闻标题,翻译,数据集,自然语言处理,机器翻译,语言学,媒体分析 数据概述:该数据集包含来自多个来源的泰米尔语新闻标题及其英文翻译,适用于自然语言处理和机器翻译等任务。主要特征如下:... -
自然语言处理语言检测数据集LanguageDetectionNLPDataset-tharun369
自然语言处理语言检测数据集LanguageDetectionNLPDataset-tharun369 数据来源:互联网公开数据 标签:自然语言处理,语言检测,数据集,文本分析,机器学习,文本分类,语言学,计算机科学 数据概述:该数据集包含来自多个来源的文本数据,用于自然语言处理中的语言检测任务。主要特征如下:...