找到667个数据集

标签: 语言学

过滤结果
  • 奥斯曼土耳其语通用依存关系数据集OttomanTurkishUniversalDependenciesDataset-emirkaanozdemr

    2025年4月24日   

    奥斯曼土耳其语通用依存关系数据集OttomanTurkishUniversalDependenciesDataset-emirkaanozdemr 数据来源:互联网公开数据 标签:自然语言处理,土耳其语,依存分析,数据集,语言学,NLP,文本分析,历史语言 数据概述: 该数据集包含奥斯曼土耳其语的文本数据,并标注了通用依存关系。主要特征如下:...
    packageimg
  • 越南语字幕数据集DataCaptiontoVietnameseDataset-tndtnguyn

    2025年4月24日   

    越南语字幕数据集DataCaptiontoVietnameseDataset-tndtnguyn 数据来源:互联网公开数据 标签:字幕翻译,越南语,数据集,机器翻译,自然语言处理,文本分析,语言学,跨语言 数据概述:该数据集包含从英语到越南语的字幕翻译数据,用于字幕翻译任务。主要特征如下: 时间跨度:数据记录的时间范围不明确,取决于数据来源。...
    packageimg
  • 仇恨言论检测平衡数据集-nirmalgaud

    2025年4月24日   

    仇恨言论检测平衡数据集-nirmalgaud 数据来源:互联网公开数据 标签:仇恨言论,文本分析,自然语言处理,情感分析,数据集,机器学习,社交媒体,语言学 数据概述: 该数据集收录了来自社交媒体平台的文本数据,旨在用于仇恨言论的检测与识别。主要特征如下: 时间跨度:数据记录的时间范围不明确,但涵盖了社交媒体上常见的文本内容发布时间。...
    packageimg
  • 泰卢固语英语翻译数据集TeluguEnglishTranslationDataset-gautamashastry

    2025年4月24日   

    泰卢固语英语翻译数据集TeluguEnglishTranslationDataset-gautamashastry 数据来源:互联网公开数据 标签:泰卢固语,英语,翻译,数据集,语言学,自然语言处理,机器学习,文本分析 数据概述:该数据集包含来自多个来源的泰卢固语和英语的翻译数据,用于研究和开发语言翻译模型。主要特征如下:...
    packageimg
  • 多领域罗马乌尔都语语料库数据集Multi-DomainRomanUrduCorpusDataset-marwakhanfastnulhr

    2025年4月24日   

    多领域罗马乌尔都语语料库数据集Multi-DomainRomanUrduCorpusDataset-marwakhanfastnulhr 数据来源:互联网公开数据 标签:自然语言处理,语料库,罗马乌尔都语,文本分析,多领域,文本分类,机器翻译,语言学 数据概述:...
    packageimg
  • 乌尔都语罗马体诗歌数据集RomanUrduPoetryDataset-mianahmadhasan

    2025年4月24日   

    乌尔都语罗马体诗歌数据集RomanUrduPoetryDataset-mianahmadhasan 数据来源:互联网公开数据 标签:诗歌,乌尔都语,罗马体,文本分析,自然语言处理,语言学,数据集,文化研究 数据概述: 该数据集包含了用罗马字母转写的乌尔都语诗歌,旨在促进乌尔都语诗歌的文本分析和研究。主要特征如下: 时间跨度:...
    packageimg
  • 阿拉伯语情感分析数据集-ouaraskhelilrafik

    2025年4月24日   

    阿拉伯语情感分析数据集-ouaraskhelilrafik 数据来源:互联网公开数据 标签:情感分析,阿拉伯语,自然语言处理,NLP,文本数据,机器学习,语言学,情感分类 数据概述: 该数据集包含阿拉伯语文本及其对应的情感标签,用于情感分析研究。主要特征如下: 时间跨度:数据的时间跨度取决于具体的数据来源,通常涵盖近年。...
    packageimg
  • 孟加拉语仇恨言论与俚语数据集-arkabhattachajee01

    2025年4月24日   

    孟加拉语仇恨言论与俚语数据集-arkabhattachajee01 数据来源:互联网公开数据 标签:仇恨言论,俚语,孟加拉语,自然语言处理,文本分类,情感分析,社交媒体,语言学 数据概述: 该数据集包含了孟加拉语社交媒体上的仇恨言论,其中部分言论使用了俚语。主要特征如下: 时间跨度:数据记录的时间范围未知,但通常反映了社交媒体上的近期言论。...
    packageimg
  • 俄罗斯幽默笑话文本数据集

    2025年4月24日   

    俄罗斯幽默笑话文本数据集 数据来源:互联网公开数据 标签:俄罗斯,幽默,笑话,文本,语言学,文化,娱乐 数据概述: 本数据集收录了来自俄罗斯笑话聚合网站的笑话文本。这些笑话内容涵盖了广泛的主题和风格,反映了俄罗斯独特的幽默文化。数据集由IgorVolochay在Hugging Face上发布,原始数据来源于公开的网络资源。 数据用途概述:...
    packageimg
  • 希望演讲英语修改数据集-praneeshsharma

    2025年4月24日   

    希望演讲英语修改数据集-praneeshsharma 数据来源:互联网公开数据 标签:演讲,英语,数据集,语音识别,自然语言处理,文本分析,机器学习,语言学 数据概述: 该数据集包含修改后的英语演讲数据,旨在用于语音识别,自然语言处理和文本分析等研究。主要特征如下: 时间跨度:数据记录的时间范围跨度不确定,取决于演讲内容和录制时间。...
    packageimg
  • 中文文本翻译数据集TranslatedTextDataset-amithsurasani

    2025年4月24日   

    中文文本翻译数据集TranslatedTextDataset-amithsurasani 数据来源:互联网公开数据 标签:文本翻译,数据集,自然语言处理,机器学习,语言学,人工智能,多语言,文本分析 数据概述: 该数据集包含来自互联网公开来源的中文文本翻译数据,记录了多种语言与中文之间的翻译对。主要特征如下:...
    packageimg
  • 美国手语短语数据集AmericanSignLanguagePhrasesDataset-gkontogiannis

    2025年4月24日   

    美国手语短语数据集AmericanSignLanguagePhrasesDataset-gkontogiannis 数据来源:互联网公开数据 标签:手语识别,数据集,计算机视觉,深度学习,多模态,教育技术,语言学,人工智能 数据概述: 该数据集包含美国手语(ASL)的短语和句子数据,记录了手语表达的视频或图像信息。主要特征如下:...
    packageimg
  • 词汇数据集Lexicon-CleanDataset-jvmchik

    2025年4月24日   

    词汇数据集Lexicon-CleanDataset-jvmchik 数据来源:互联网公开数据 标签:语言学,词汇学,数据集,自然语言处理,文本分析,教育研究,数据清洗,语言资源 数据概述: 该数据集包含经过清洗和标准化的词汇数据,记录了多种语言的词汇信息。主要特征如下: 时间跨度:数据记录的时间范围不明确,主要为静态词汇数据。...
    packageimg
  • 英语到约鲁巴语翻译数据集EnglishtoYorubaTranslationDataset-salisuyahaya

    2025年4月24日   

    英语到约鲁巴语翻译数据集EnglishtoYorubaTranslationDataset-salisuyahaya 数据来源:互联网公开数据 标签:英语翻译,约鲁巴语,数据集,自然语言处理,机器学习,语言学,人工智能,文本翻译 数据概述: 该数据集包含来自互联网的英语到约鲁巴语的翻译数据,记录了多种主题的英语文本及其对应的约鲁巴语翻译。主要特征如下:...
    packageimg
  • 字幕分析数据集SubtitleAnalysisDataset-bhagvendersingh

    2025年4月24日   

    字幕分析数据集SubtitleAnalysisDataset-bhagvendersingh 数据来源:互联网公开数据 标签:字幕,数据集,文本分析,自然语言处理,机器学习,视频内容分析,语言学,文本挖掘 数据概述:该数据集包含来自多个视频平台的字幕数据,记录了不同视频内容的字幕文本,适用于文本分析,自然语言处理等任务。主要特征如下:...
    packageimg
  • WordNet超义词数据集-2006-duketemon

    2025年4月24日   

    WordNet超义词数据集-2006-duketemon 数据来源:互联网公开数据 标签:WordNet,超义词,语义关系,自然语言处理,NLP,语言学,数据集 数据概述:...
    packageimg
  • 英语词汇频率统计数据集WordsCSVDataset-jasperbutcher

    2025年4月24日   

    英语词汇频率统计数据集WordsCSVDataset-jasperbutcher 数据来源:互联网公开数据 标签:自然语言处理,文本分析,词频统计,数据集,语言学,词汇学习,机器学习,统计分析 数据概述: 该数据集包含了来自互联网的大量文本数据,记录了英语词汇的出现频率。主要特征如下:...
    packageimg
  • 孟加拉语虚假新闻分类数据集-hakim11

    2025年4月24日   

    孟加拉语虚假新闻分类数据集-hakim11 数据来源:互联网公开数据 标签:虚假新闻,孟加拉语,自然语言处理,文本分类,机器学习,新闻分析,语言学,情感分析 数据概述:该数据集包含孟加拉语的虚假新闻文本,用于进行虚假新闻的检测与分类。主要特征如下: 时间跨度:数据收集的时间范围不明确,但包含了近期发布的新闻。...
    packageimg
  • 孟加拉电子产品分词数据集BanglaElectronicsLemmatizedFinalDataset-nirajmahi

    2025年4月24日   

    孟加拉电子产品分词数据集BanglaElectronicsLemmatizedFinalDataset-nirajmahi 数据来源:互联网公开数据 标签:电子产品,数据集,分词,自然语言处理,机器学习,文本分析,语言学,数据挖掘 数据概述: 该数据集包含来自孟加拉国电子产品领域的分词数据,记录了电子产品相关的文本信息。主要特征如下:...
    packageimg
  • 尼泊尔语同义词词汇列表-来自尼泊尔语词典的词汇数据-教育用途-thenepaliguy

    2025年4月24日   

    尼泊尔语同义词词汇列表-来自尼泊尔语词典的词汇数据-教育用途-thenepaliguy 数据来源:互联网公开数据 标签:尼泊尔语,词汇,同义词,语言学,词典,教育,Pragyaprathisthan,SABDABIKASH 数据概述:...
    packageimg