-
英语到孟加拉语翻译数据集EnglishtoBengaliTranslationDataset-ritankardas
英语到孟加拉语翻译数据集EnglishtoBengaliTranslationDataset-ritankardas 数据来源:互联网公开数据 标签:语言翻译,数据集,自然语言处理,机器学习,语言模型,文本分析,多语言,人工智能 数据概述: 该数据集包含英语到孟加拉语的平行语料,记录了双语翻译的对应句子。主要特征如下:... -
语言识别数据集HalfdatasetLanguageIdentificationDataset-amitverma2030
语言识别数据集HalfdatasetLanguageIdentificationDataset-amitverma2030 数据来源:互联网公开数据 标签:语言识别,数据集,自然语言处理,机器学习,文本分类,多语言,数据挖掘,人工智能 数据概述: 该数据集包含来自多个语言样本的文本数据,记录了不同语言的文本片段及其对应的语言标签。主要特征如下:... -
印地语与英语混合语言数据集Hindi-EnglishCodemixBalancedDataset-pinakisahu2
印地语与英语混合语言数据集Hindi-EnglishCodemixBalancedDataset-pinakisahu2 数据来源:互联网公开数据 标签:语言混合,数据集,自然语言处理,多语言,机器学习,文本分析,语言研究,翻译技术 数据概述: 该数据集包含来自印地语与英语混合语言环境的数据,记录了两种语言在文本中的混合使用情况。主要特征如下:... -
Jigsaw多语言有毒评论分类数据集-评论翻译与情感分析增强版
Jigsaw多语言有毒评论分类数据集-评论翻译与情感分析增强版 数据来源:互联网公开数据 标签:文本分类,自然语言处理,情感分析,多语言,有毒评论,评论数据,机器翻译,英语,机器学习 数据概述:... -
英语到印地语翻译数据集English-to-HindiTranslationDataset-vimlkumar
英语到印地语翻译数据集English-to-HindiTranslationDataset-vimlkumar 数据来源:互联网公开数据 标签:机器翻译,语言处理,数据集,印地语,英语,自然语言处理,翻译研究,多语言 数据概述: 该数据集包含英语到印地语的翻译对,记录了4000个英语句子及其对应的印地语翻译。主要特征如下:... -
多语言标记数据集MultilangTokensDataset-pranav51286
多语言标记数据集MultilangTokensDataset-pranav51286 数据来源:互联网公开数据 标签:自然语言处理,数据集,多语言,文本分析,词汇分析,机器翻译,语言学,深度学习 数据概述: 该数据集包含多种语言的文本数据,用于自然语言处理任务,特别是多语言文本分析和模型训练。主要特征如下:... -
欧洲足球俱乐部推特内容数据集-2021-2022-eliasdabbas
欧洲足球俱乐部推特内容数据集-2021-2022-eliasdabbas 数据来源:互联网公开数据 标签:足球,推特,社交媒体,俱乐部,欧洲,数据分析,多语言,粉丝互动 数据概述:... -
多语言自然语言推理与跨语言推理数据集
多语言自然语言推理与跨语言推理数据集 数据来源:互联网公开数据 标签:自然语言推理,跨语言推理,多语言,文本分类,模型训练,迁移学习,句子对分类 数据概述: 本数据集结合了MNLI(多领域自然语言推理)和XNLI(跨语言自然语言推理)数据集,并扩展了NLI数据,提供了一个丰富的多语言资源,适用于自然语言推理任务的研究和开发。数据集包含多个语言中的前提-... -
葡萄牙语文本分类数据集PortugueseTextClassificationDataset-rookiejing
葡萄牙语文本分类数据集PortugueseTextClassificationDataset-rookiejing 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,语言模型,机器学习,多语言,文本分析,语言学 数据概述: 该数据集包含来自葡萄牙语互联网的文本数据,专门用于葡萄牙语的文本分类任务。主要特征如下:... -
多语言自然语言推理数据集MultilingualNLPInferenceDataset-sanjusrivatsa9
多语言自然语言推理数据集MultilingualNLPInferenceDataset-sanjusrivatsa9 数据来源:互联网公开数据 标签:自然语言处理,多语言,推理,数据集,机器学习,深度学习,人工智能,文本分析 数据概述: 该数据集包含来自多个来源的多语言文本数据,专门用于自然语言推理任务。主要特征如下: 时间跨度:... -
多语言仇恨言论检测数据集MultilingualHateSpeechDetectionDataset-fida5073
多语言仇恨言论检测数据集MultilingualHateSpeechDetectionDataset-fida5073 数据来源:互联网公开数据 标签:仇恨言论,多语言,自然语言处理,文本分类,机器学习,情感分析,社交媒体,数据集 数据概述: 该数据集包含来自社交媒体平台的多语言文本数据,旨在用于仇恨言论的检测和分类。主要特征如下:... -
语言翻译数据集LanguageTranslationDataset-rohitwaldekar
语言翻译数据集LanguageTranslationDataset-rohitwaldekar 数据来源:互联网公开数据 标签:语言翻译,数据集,机器学习,自然语言处理,文本分析,多语言,人工智能,数据挖掘 数据概述: 该数据集包含来自多个语言翻译项目的数据,记录了不同语言之间的文本翻译对。主要特征如下:... -
尼日利亚多语言仇恨言论数据集2024-sharonibejih
尼日利亚多语言仇恨言论数据集2024-sharonibejih 数据来源:互联网公开数据 标签:仇恨言论,尼日利亚,多语言,机器翻译,社交媒体,数据分析 数据概述:... -
代码混合数据集CodeMixData-shankhad
代码混合数据集CodeMixData-shankhad 数据来源:互联网公开数据 标签:代码,编程,数据集,自然语言处理,机器学习,代码生成,多语言,软件工程 数据概述: 该数据集包含来自多种编程语言的代码片段和相关文本描述,旨在支持代码生成,代码理解和代码翻译等任务。主要特征如下: 时间跨度:数据记录的时间跨度不明确,主要基于公开的代码库和文档。... -
多语言词汇数据集WordswithLanguagesDataset-mansigarg18
多语言词汇数据集WordswithLanguagesDataset-mansigarg18 数据来源:互联网公开数据 标签:语言学习,词汇数据,数据集,自然语言处理,教育技术,多语言,语言学,数据挖掘 数据概述: 该数据集包含来自多种语言词汇的数据,记录了不同语言中的常见词汇及其相关信息。主要特征如下:... -
openHPI课程分类数据集-手把手项目与理论课程-johoetter
openHPI课程分类数据集-手把手项目与理论课程-johoetter 数据来源:互联网公开数据 标签:MOOC,openHPI,课程分类,教育,项目,理论,计算机科学,多语言 数据概述: 本数据集包含了Hasso Plattner... -
Contradictory-MyDearWatson英文翻译数据集-2023-anikok
Contradictory-MyDearWatson英文翻译数据集-2023-anikok 数据来源:互联网公开数据 标签:Contradictory,My Dear Watson,英语翻译,自然语言处理,数据集,翻译,多语言,不平衡数据 数据概述: 本数据集是Contradictory, My Dear... -
全球新冠疫情事实核查新闻数据集-多语言多国家-2020年7月-thedevastator
全球新冠疫情事实核查新闻数据集-多语言多国家-2020年7月-thedevastator 数据来源:互联网公开数据 标签:新冠疫情,事实核查,新闻,多语言,国际,虚假信息,内容分析,文本数据 数据概述:... -
多语言短信垃圾信息与情感分析检测数据集-2023-debapampal2002
多语言短信垃圾信息与情感分析检测数据集-2023-debapampal2002 数据来源:互联网公开数据 标签:垃圾短信,多语言,情感分析,文本分析,机器学习,语言检测,数据集 数据概述:... -
COVID-19疫情研究论文多语言标注数据集-rebeccaburwei
COVID-19疫情研究论文多语言标注数据集-rebeccaburwei 数据来源:互联网公开数据 标签:COVID-19,新冠病毒,疫情,研究,论文,语言,多语言,标注,语料库,自然语言处理 数据概述:...