找到667个数据集

标签: 语言学

过滤结果
  • 电影字幕数据集Hindi-English2020-2022数据集-manishtripathi86

    2025年4月26日   

    电影字幕数据集Hindi-English2020-2022数据集-manishtripathi86 数据来源:互联网公开数据 标签:电影字幕,数据集,自然语言处理,机器翻译,语言学,多语言数据,文本分析,文化研究 数据概述:...
    packageimg
  • 肯尼亚手语数据集KenyaSignLanguageDataset-trongminhle

    2025年4月26日   

    肯尼亚手语数据集KenyaSignLanguageDataset-trongminhle 数据来源:互联网公开数据 标签:手语,数据集,肯尼亚,语言学,图像识别,机器学习,聋人社区,文化研究 数据概述: 该数据集包含肯尼亚手语的视频数据,记录了不同手语词汇和短语的视觉表现。主要特征如下:...
    packageimg
  • 摩洛哥阿拉伯语仇恨言论检测数据集DarijaHateSpeechDetectionDataset-hindamg

    2025年4月25日   

    摩洛哥阿拉伯语仇恨言论检测数据集DarijaHateSpeechDetectionDataset-hindamg 数据来源:互联网公开数据 标签:仇恨言论,自然语言处理,数据集,阿拉伯语,文本分类,情感分析,机器学习,语言学 数据概述: 该数据集包含摩洛哥阿拉伯语(Darija)文本,用于仇恨言论检测任务。主要特征如下: 时间跨度:...
    packageimg
  • 古兰经数据集QuranDataDataset-raghadraghad

    2025年4月25日   

    古兰经数据集QuranDataDataset-raghadraghad 数据来源:互联网公开数据 标签:古兰经,宗教,数据集,文本分析,语言学,文学,语义分析,伊斯兰研究 数据概述: 该数据集包含了古兰经的文本数据,适用于宗教研究,文本分析和语言学研究等任务。主要特征如下: 时间跨度:数据记录的时间范围覆盖了古兰经的成书时期及后续版本。...
    packageimg
  • 英法机器翻译数据集EnglishtoFrenchMachineTranslationDataset-arvindvasa

    2025年4月25日   

    英法机器翻译数据集EnglishtoFrenchMachineTranslationDataset-arvindvasa 数据来源:互联网公开数据 标签:机器翻译,数据集,自然语言处理,语言学,人工智能,文本分析,翻译技术,语言模型 数据概述:该数据集提供了英法翻译任务中使用的文本数据,记录了大量英文与对应法文的翻译对。主要特征如下:...
    packageimg
  • 波斯语数据集PersianDataset-amirali10281

    2025年4月25日   

    波斯语数据集PersianDataset-amirali10281 数据来源:互联网公开数据 标签:波斯语,语言学,自然语言处理,数据集,文本分析,机器翻译,文本分类,语音识别 数据概述: 该数据集包含波斯语文本和相关数据,旨在为波斯语语言处理研究提供支持。主要特征如下: 时间跨度:数据记录的时间跨度不固定,涵盖了不同时期和类型的波斯语文本。...
    packageimg
  • 孟加拉语文本情感分析数据集-shadikaafroze

    2025年4月25日   

    孟加拉语文本情感分析数据集-shadikaafroze 数据来源:互联网公开数据 标签:自然语言处理,情感分析,文本数据,孟加拉语,机器学习,情感分类,数据集,语言学 数据概述: 该数据集包含孟加拉语文本数据,用于情感分析任务。主要特征如下: 时间跨度:数据收集时间跨度未知,但包含了近期和历史的孟加拉语文本。...
    packageimg
  • 突尼斯自然语言处理数据集NLPTunisiaDataset-mikemollel

    2025年4月25日   

    突尼斯自然语言处理数据集NLPTunisiaDataset-mikemollel 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分析,突尼斯语,语言学,机器学习,人工智能,文本挖掘 数据概述:该数据集包含来自突尼斯的自然语言处理数据,记录了突尼斯语文本的多方面信息。主要特征如下: 时间跨度:数据记录的时间范围从2016年到2021年。...
    packageimg
  • 印度人名数据集IndianNamesDataset-chaitanyapatil7

    2025年4月25日   

    印度人名数据集IndianNamesDataset-chaitanyapatil7 数据来源:互联网公开数据 标签:人名,印度,数据集,语言学,文化研究,数据挖掘,机器学习,身份识别 数据概述: 该数据集包含来自印度的常见人名数据,记录了印度不同地区,民族和宗教背景下的姓名信息。主要特征如下: 时间跨度:数据记录的时间范围从20世纪至今。...
    packageimg
  • 阿拉伯语文本情感分析数据集-akshat18

    2025年4月25日   

    阿拉伯语文本情感分析数据集-akshat18 数据来源:互联网公开数据 标签:自然语言处理,情感分析,阿拉伯语,文本数据,机器学习,语言学,舆情分析,文本分类 数据概述: 该数据集包含了大量的阿拉伯语文本,并标注了相应的情感极性。主要特征如下: 时间跨度: 数据未明确时间跨度,但数据内容反映了当前社会和文化背景。 地理范围:...
    packageimg
  • 英语词汇与定义数据集VAL-EN-DFDataset-bamps53

    2025年4月25日   

    英语词汇与定义数据集VAL-EN-DFDataset-bamps53 数据来源:互联网公开数据 标签:英语词汇,定义,数据集,自然语言处理,词义消歧,语言学,文本分析,机器学习 数据概述: 该数据集包含了大量的英语词汇及其对应的定义,主要用于自然语言处理和语言学研究。主要特征如下: 时间跨度:数据记录的时间范围不限,持续更新。...
    packageimg
  • 乌尔都语情感分析语料库数据集UrduSentimentCorpusNLPDataset-muhammadrabeebinamir

    2025年4月25日   

    乌尔都语情感分析语料库数据集UrduSentimentCorpusNLPDataset-muhammadrabeebinamir 数据来源:互联网公开数据 标签:情感分析,自然语言处理,乌尔都语,文本数据,数据集,情感分类,语言学,机器学习 数据概述: 该数据集包含乌尔都语文本数据,用于情感分析任务。主要特征如下:...
    packageimg
  • 印地语-英语混合语言数据集-saahir2629

    2025年4月25日   

    印地语-英语混合语言数据集-saahir2629 数据来源:互联网公开数据 标签:印地语,英语,混合语言,数据集,自然语言处理,文本分析,机器翻译,语言学 数据概述:该数据集包含印地语和英语混合语言的文本数据,记录了两种语言混合使用的各种场景。主要特征如下: 时间跨度:数据记录的时间范围不明确,但包含了现代社交媒体和日常交流中的常见用例。...
    packageimg
  • 英语俚语词典数据集EnglishSlangDictionaryDataset-emreucar35

    2025年4月25日   

    英语俚语词典数据集EnglishSlangDictionaryDataset-emreucar35 数据来源:互联网公开数据 标签:语言学,词典,俚语,词汇学,数据集,语言研究,文化研究,教育工具 数据概述: 该数据集包含来自公开资源整理的英语俚语词典数据,记录了英语俚语的词条,释义,使用场景及例句。主要特征如下:...
    packageimg
  • 达里贾语开放数据集DarijaOpenDataset-youneselbouknify

    2025年4月25日   

    达里贾语开放数据集DarijaOpenDataset-youneselbouknify 数据来源:互联网公开数据 标签:达里贾语,语言数据,自然语言处理,数据集,语料库,人工智能,机器学习,语言学 数据概述:该数据集包含来自不同来源的达里贾语(摩洛哥阿拉伯语方言)文本数据,记录了日常对话,新闻报道,社交媒体帖子等多种类型的文本内容。主要特征如下:...
    packageimg
  • 英语到希伯来语圣经翻译数据集English-to-HebrewBibleTranslationsDataset-williamalabi

    2025年4月25日   

    英语到希伯来语圣经翻译数据集English-to-HebrewBibleTranslationsDataset-williamalabi 数据来源:互联网公开数据 标签:圣经翻译,语言学,数据集,机器翻译,文本分析,宗教研究,自然语言处理,多语言 数据概述: 该数据集包含英语到希伯来语的圣经翻译文本,记录了圣经经文的双语对照内容。主要特征如下:...
    packageimg
  • 民间故事词批处理数据集-siyliu

    2025年4月25日   

    民间故事词批处理数据集-siyliu 数据来源:互联网公开数据 标签:民间故事,文本分析,词向量,自然语言处理,数据集,情感分析,文化研究,语言学 数据概述:该数据集包含来自民间故事的文本数据,旨在用于文本分析和自然语言处理研究。主要特征如下: 时间跨度:数据记录的时间范围不限,涵盖了不同历史时期的民间故事。...
    packageimg
  • 平行约鲁巴语与英语翻译提示数据集ParallelYoruba-EnglishPromptsforTranslationDataset-danishbaloch010

    2025年4月25日   

    平行约鲁巴语与英语翻译提示数据集ParallelYoruba-EnglishPromptsforTranslationDataset-danishbaloch010 数据来源:互联网公开数据 标签:约鲁巴语,英语,翻译,平行语料库,自然语言处理,机器翻译,语言学,数据集...
    packageimg
  • 情绪识别原始数据数据集-rahulshelke98

    2025年4月25日   

    情绪识别原始数据数据集-rahulshelke98 数据来源:互联网公开数据 标签:情绪识别,情感分析,数据集,文本分析,自然语言处理,机器学习,心理学,语言学 数据概述: 该数据集包含来自多个来源的原始情绪数据,旨在用于情绪识别和情感分析研究。主要特征如下: 时间跨度: 数据记录的时间范围不固定,涵盖了不同时间段的情绪表达。 地理范围:...
    packageimg
  • 改进型核心ference数据集ModifiedCoreferenceDataset-dhan29

    2025年4月25日   

    改进型核心ference数据集ModifiedCoreferenceDataset-dhan29 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,核心ference识别,机器学习,语义理解,语言学,深度学习 数据概述:...
    packageimg