找到667个数据集

标签: 语言学

过滤结果
  • 罗曼诗歌数据集RomanPoetryDataset-mustafa2003

    2025年4月24日   

    罗曼诗歌数据集RomanPoetryDataset-mustafa2003 数据来源:互联网公开数据 标签:诗歌,文学,数据集,文本分析,语言学,机器翻译,文化研究,古典文学 数据概述: 该数据集包含来自罗马时期的诗歌作品,记录了古罗马诗人创作的经典诗歌。主要特征如下: 时间跨度:数据记录的时间范围从公元前2世纪到公元4世纪。...
    packageimg
  • 英语到泰卢固语翻译数据集-krizzna69

    2025年4月24日   

    英语到泰卢固语翻译数据集-krizzna69 数据来源:互联网公开数据 标签:机器翻译,语言学,数据集,泰卢固语,英语,自然语言处理,深度学习,翻译模型 数据概述: 该数据集包含英语到泰卢固语的翻译数据,记录了英语句子及其对应的泰卢固语翻译。主要特征如下: 时间跨度:数据记录的时间跨度不限,通常涵盖不同时期和语境下的翻译。...
    packageimg
  • 亚马逊评论情感分析罗马乌尔都语数据集-vivekyadav21

    2025年4月24日   

    亚马逊评论情感分析罗马乌尔都语数据集-vivekyadav21 数据来源:互联网公开数据 标签:情感分析,罗马乌尔都语,数据集,自然语言处理,机器学习,文本分析,亚马逊评论,语言学 数据概述: 该数据集包含了来自亚马逊的罗马乌尔都语评论数据,用于情感分析任务。主要特征如下: 时间跨度: 数据记录时间跨度未知,但包含了亚马逊用户在一定时期内发表的评论。...
    packageimg
  • 土耳其语-英语和匈牙利语手写数据集-yasiradoan

    2025年4月24日   

    土耳其语-英语和匈牙利语手写数据集-yasiradoan 数据来源:互联网公开数据 标签:手写识别,数据集,OCR,语言学,深度学习,土耳其语,英语,匈牙利语 数据概述:该数据集包含土耳其语,英语和匈牙利语的手写文本数据,旨在促进跨语言的手写识别研究。主要特征如下: 时间跨度:数据记录的时间范围不详,但包含了多种语言的样本。...
    packageimg
  • 韩语圣经经典与现代版本对照数据集-rycont

    2025年4月24日   

    韩语圣经经典与现代版本对照数据集-rycont 数据来源:互联网公开数据 标签:圣经,韩语,语言学,文本分析,数据集,翻译研究,对比分析,文化研究 数据概述:该数据集包含韩语圣经经典版本和现代版本的对照数据,记录了不同翻译版本之间的对应关系。主要特征如下: 时间跨度:数据涵盖了韩语圣经的经典版本和现代版本。 地理范围:数据主要关注韩国及其韩语使用者。...
    packageimg
  • 旁遮普语情感分析数据集PunjabiEmotionData-sahib12

    2025年4月24日   

    旁遮普语情感分析数据集PunjabiEmotionData-sahib12 数据来源:互联网公开数据 标签:情感分析,自然语言处理,旁遮普语,数据集,文本分类,机器学习,语言学,印度文化 数据概述: 该数据集包含了旁遮普语的文本数据,标注了相应的情感标签,主要用于情感分析研究。主要特征如下: 时间跨度:...
    packageimg
  • Wassa2011-2016社交媒体文本数据集EkphrasisWassaData-SocialMediaTextDataset2011-2016-mar...

    2025年4月24日   

    Wassa2011-2016社交媒体文本数据集EkphrasisWassaData-SocialMediaTextDataset2011-2016-marouanesidali 数据来源:互联网公开数据 标签:社交媒体,文本分析,情感分析,自然语言处理,数据集,情感识别,语言学,机器学习 数据概述:...
    packageimg
  • 社交媒体隐含仇恨言论检测数据集ImplicitHateSpeechDetectiononSocialMediaDataset-devayani14

    2025年4月24日   

    社交媒体隐含仇恨言论检测数据集ImplicitHateSpeechDetectiononSocialMediaDataset-devayani14 数据来源:互联网公开数据 标签:仇恨言论,社交媒体,文本分析,自然语言处理,机器学习,情感分析,数据挖掘,语言学 数据概述:...
    packageimg
  • 印地语语法学习数据集-donutkashvi

    2025年4月24日   

    印地语语法学习数据集-donutkashvi 数据来源:互联网公开数据 标签:印地语,语法,语言学,数据集,自然语言处理,文本分析,教育,机器学习 数据概述: 该数据集包含印地语语法学习相关的数据,旨在为印地语学习者和语言学研究人员提供资源。主要特征如下: 时间跨度:数据收集时间跨度不定,涵盖了印地语的多种语法现象。...
    packageimg
  • 对话记录清理数据集TranscriptCleanedDataset-mariamfaroukgadalla

    2025年4月24日   

    对话记录清理数据集TranscriptCleanedDataset-mariamfaroukgadalla 数据来源:互联网公开数据 标签:对话记录,文本清理,数据集,自然语言处理,机器学习,文本分析,数据预处理,语言学 数据概述:该数据集包含经过清理的对话记录,适用于自然语言处理,文本分析等任务。主要特征如下:...
    packageimg
  • 语言检测数据集LanguageDetectionDataset-trinhtung

    2025年4月24日   

    语言检测数据集LanguageDetectionDataset-trinhtung 数据来源:互联网公开数据 标签:语言检测,自然语言处理,数据集,文本分析,机器学习,人工智能,数据科学,语言学 数据概述: 该数据集包含来自多个来源的文本数据,用于语言检测任务。主要特征如下: 时间跨度: 数据记录的时间范围从2010年到2022年。 地理范围:...
    packageimg
  • 藏文引文命名实体识别数据集TibetanCitationsforNER-tenzinx

    2025年4月24日   

    藏文引文命名实体识别数据集TibetanCitationsforNER-tenzinx 数据来源:互联网公开数据 标签:藏文文献,命名实体识别,数据集,自然语言处理,机器学习,学术研究,文本分析,语言学 数据概述:该数据集包含来自藏文文献的引文数据,用于命名实体识别(NER)任务。主要特征如下: 时间跨度:数据记录的时间范围从2000年到2022年。...
    packageimg
  • 维基百科法语数据集WikipediaFrenchDataset-manueldesiretaira

    2025年4月24日   

    维基百科法语数据集WikipediaFrenchDataset-manueldesiretaira 数据来源:互联网公开数据 标签:维基百科,法语,数据集,自然语言处理,文本分析,语言学,机器学习,信息检索 数据概述: 该数据集包含来自维基百科的法语语言内容,记录了多个领域的百科全书条目。主要特征如下:...
    packageimg
  • 圣经多语言阿拉伯语-法语数据集-oumarbenlol

    2025年4月24日   

    圣经多语言阿拉伯语-法语数据集-oumarbenlol 数据来源:互联网公开数据 标签:圣经,多语言,阿拉伯语,法语,文本数据,自然语言处理,语言学,翻译 数据概述: 该数据集包含圣经的阿拉伯语和法语翻译版本,旨在支持跨语言研究和文本分析。主要特征如下: 时间跨度:数据涵盖了圣经的完整文本,版本内容依据发布时间而定。...
    packageimg
  • 自然语言处理文本数据集NaturalLanguageProcessNLPDataset-bulentsiyah

    2025年4月24日   

    自然语言处理文本数据集NaturalLanguageProcessNLPDataset-bulentsiyah 数据来源:互联网公开数据 标签:自然语言处理,文本数据,数据集,机器学习,语义分析,文本挖掘,语言学,人工智能 数据概述:该数据集包含来自多个来源的文本数据,涵盖了各种类型的文本,适用于自然语言处理和机器学习等任务。主要特征如下:...
    packageimg
  • 词性标注英文语料库数据集TaggedWordsDataset-ramakrushnamohapatra

    2025年4月24日   

    词性标注英文语料库数据集TaggedWordsDataset-ramakrushnamohapatra 数据来源:互联网公开数据 标签:词性标注,数据集,自然语言处理,机器学习,语言学,文本分析,学术研究,信息检索 数据概述:该数据集包含来自Penn Treebank的词性标注数据,记录了英文文本中每个单词的词性和上下文信息。主要特征如下:...
    packageimg
  • 豪萨语语料库数据集HausaCorporaDataset-isadutse

    2025年4月24日   

    豪萨语语料库数据集HausaCorporaDataset-isadutse 数据来源:互联网公开数据 标签:豪萨语,语料库,语言学,自然语言处理,机器翻译,数据集,学术研究,文化研究 数据概述:该数据集包含来自多种来源的豪萨语语料,记录了豪萨语的文本数据,适用于语言学研究,自然语言处理和机器翻译等任务。主要特征如下:...
    packageimg
  • 星际迷航-深空九号剧本数据集StarTrek-DeepSpaceNineScriptsDataset-daedalusdreamjournal

    2025年4月24日   

    星际迷航-深空九号剧本数据集StarTrek-DeepSpaceNineScriptsDataset-daedalusdreamjournal 数据来源:互联网公开数据 标签:影视剧本,星际迷航,数据集,剧本分析,文本挖掘,科幻,文化研究,语言学 数据概述: 该数据集包含来自《星际迷航:深空九号》(Star Trek: Deep Space Nine,...
    packageimg
  • 豪萨语情感分析数据集HausaSentimentAnalysisDataset-sambonuruddeen

    2025年4月24日   

    豪萨语情感分析数据集HausaSentimentAnalysisDataset-sambonuruddeen 数据来源:互联网公开数据 标签:情感分析,自然语言处理,豪萨语,文本分析,机器学习,语言学,非洲语言,情感分类 数据概述: 该数据集包含用于豪萨语情感分析的文本数据,旨在研究和开发针对豪萨语的文本情感分析模型。主要特征如下: 时间跨度:...
    packageimg
  • 无事实依据的笑话数据集-j0hann

    2025年4月24日   

    无事实依据的笑话数据集-j0hann 数据来源:互联网公开数据 标签:笑话,数据集,文本分析,自然语言处理,情感分析,娱乐,语言学,机器学习 数据概述: 该数据集包含了大量无事实依据的笑话,旨在用于文本分析,自然语言处理和机器学习模型训练。主要特征如下: 时间跨度:数据记录的时间范围不限,涵盖了不同时期和来源的笑话。...
    packageimg