找到667个数据集

标签: 语言学

过滤结果
  • 乌尔都语威胁言论检测数据集-oyehoney19

    2025年4月26日   

    乌尔都语威胁言论检测数据集-oyehoney19 数据来源:互联网公开数据 标签:自然语言处理,威胁言论检测,乌尔都语,文本分析,机器学习,情感分析,社交媒体,语言学 数据概述: 该数据集包含乌尔都语文本数据,旨在用于威胁言论的检测和分析。主要特征如下: 时间跨度:数据记录的时间范围不明确,取决于数据来源的发布时间。...
    packageimg
  • 齐夫定律特征数据集Zipf-sLawFeatureDataset-mohamedchakerouari

    2025年4月26日   

    齐夫定律特征数据集Zipf-sLawFeatureDataset-mohamedchakerouari 数据来源:互联网公开数据 标签:文本分析,自然语言处理,齐夫定律,数据集,词频分析,机器学习,语言学,信息检索 数据概述: 该数据集包含文本数据及其对应的齐夫定律特征,用于研究词频分布和文本特征提取。主要特征如下:...
    packageimg
  • 韩语到越南语翻译数据集112KKoreantoVietnameseDataset-quanghuyho06

    2025年4月26日   

    韩语到越南语翻译数据集112KKoreantoVietnameseDataset-quanghuyho06 数据来源:互联网公开数据 标签:翻译数据集,自然语言处理,机器学习,数据集,语言学,文本翻译,韩语,越南语 数据概述:该数据集包含来自互联网公开资源的112,000条韩语到越南语的翻译对,适用于自然语言处理和机器翻译任务。主要特征如下:...
    packageimg
  • 方言语音识别数据集DialectDataset1-方言语音识别数据集-bedooralmareni

    2025年4月26日   

    方言语音识别数据集DialectDataset1-方言语音识别数据集-bedooralmareni 数据来源:互联网公开数据 标签:方言语音,语音识别,数据集,自然语言处理,机器学习,人工智能,语音技术,语言学 数据概述:该数据集包含来自不同地区和方言的语音录音,记录了各类方言的语音特征和发音方式。主要特征如下:...
    packageimg
  • 数据1985年阿尔巴尼亚百科全书数据集-ashahini

    2025年4月26日   

    1985年阿尔巴尼亚百科全书数据集-ashahini 数据来源:互联网公开数据 标签:百科全书,历史,文化,阿尔巴尼亚,数据集,语言学,社会学,人文科学,信息检索 数据概述: 该数据集包含来自1985年出版的《阿尔巴尼亚百科全书》的数据,记录了阿尔巴尼亚的历史,文化,地理,人物,事件等信息。主要特征如下:...
    packageimg
  • 形态学分析数据集-faizankhan6356

    2025年4月26日   

    形态学分析数据集-faizankhan6356 数据来源:互联网公开数据 标签:形态学,语言学,自然语言处理,数据集,词性标注,词干提取,词形还原,文本分析 数据概述: 该数据集包含了用于形态学分析的文本数据,记录了不同语言的词汇及其形态变化信息。主要特征如下: 时间跨度:数据记录的时间范围不固定,取决于具体数据集,可能涵盖多个历史时期和现代语言。...
    packageimg
  • 俚语数据集SlangDataDataset-jhyunkim

    2025年4月26日   

    俚语数据集SlangDataDataset-jhyunkim 数据来源:互联网公开数据 标签:俚语,语言学,数据集,文本分析,自然语言处理,社交媒体,文化研究,词汇学 数据概述: 该数据集包含了大量来自互联网的俚语数据,旨在用于语言学研究,文本分析和自然语言处理等领域。主要特征如下:...
    packageimg
  • 孟加拉电子产品词汇规范化数据集BanglaElectronicsLemmatizedCSVDataset-nirajmahi

    2025年4月26日   

    孟加拉电子产品词汇规范化数据集BanglaElectronicsLemmatizedCSVDataset-nirajmahi 数据来源:互联网公开数据 标签:电子行业,词汇规范化,数据集,自然语言处理,机器学习,数据挖掘,语言学,文本分析 数据概述: 该数据集包含来自孟加拉电子行业的词汇规范化数据,记录了电子产品相关的词汇及其标准化形式。主要特征如下:...
    packageimg
  • 汉字笔画顺序数据集-dreamitpossible

    2025年4月26日   

    汉字笔画顺序数据集-dreamitpossible 数据来源:互联网公开数据 标签:汉字,笔画顺序,数据集,书写,中文,教育,语言学,汉字结构 数据概述: 该数据集包含汉字的笔画顺序数据,记录了汉字书写时笔画的正确顺序。主要特征如下: 时间跨度:数据记录的时间范围为现代。 地理范围:数据主要涵盖中国大陆地区使用的汉字。...
    packageimg
  • 罗马乌尔都语文本情感分析数据集-adilahmedcs

    2025年4月26日   

    罗马乌尔都语文本情感分析数据集-adilahmedcs 数据来源:互联网公开数据 标签:乌尔都语,罗马乌尔都语,情感分析,自然语言处理,文本数据,机器学习,语言学,社交媒体 数据概述: 该数据集包含来自互联网的罗马乌尔都语文本数据,主要用于情感分析任务。主要特征如下: 时间跨度:数据记录的时间范围不定,涵盖了从社交媒体,论坛等平台收集的近期数据。...
    packageimg
  • 中德小型语料库数据集IDXSSmallEN-DEDataset-drishyaenagpal

    2025年4月26日   

    中德小型语料库数据集IDXSSmallEN-DEDataset-drishyaenagpal 数据来源:互联网公开数据 标签:自然语言处理,机器翻译,数据集,翻译研究,语言学,文本分析,人工智能,多语言学习 数据概述:该数据集包含来自IDXS项目的小型英语到德语语料库,适用于机器翻译和语言学研究。主要特征如下:...
    packageimg
  • 英语到乌尔都语句子翻译数据集-syednabeeluddin

    2025年4月26日   

    英语到乌尔都语句子翻译数据集-syednabeeluddin 数据来源:互联网公开数据 标签:机器翻译,数据集,自然语言处理,英语,乌尔都语,翻译,语言学,深度学习 数据概述: 该数据集包含英语句子及其对应的乌尔都语翻译。主要特征如下: 时间跨度:数据记录的时间跨度不明确,但涵盖了现代英语和乌尔都语的常用表达。...
    packageimg
  • 英语-印地语平行语料库数据集English-HindiParallelCorpusDataset-rohitashchakra

    2025年4月26日   

    英语-印地语平行语料库数据集English-HindiParallelCorpusDataset-rohitashchakra 数据来源:互联网公开数据 标签:自然语言处理,机器翻译,平行语料,印地语,英语,数据集,语言学,人工智能 数据概述: 该数据集包含英语和印地语的平行文本数据,记录了两种语言之间的对应翻译内容。主要特征如下:...
    packageimg
  • 法国姓名数据集FrenchNamesDataset-syphax93

    2025年4月26日   

    法国姓名数据集FrenchNamesDataset-syphax93 数据来源:互联网公开数据 标签:姓名,数据集,人口统计,文化研究,语言学,社会学,历史,法国 数据概述: 该数据集包含来自法国的人名数据,记录了法国不同地区,不同时间阶段的常用姓名。主要特征如下: 时间跨度:数据记录的时间范围从19世纪到现代。...
    packageimg
  • 多语言问答数据集-TyDiQA可回答问题子集

    2025年4月26日   

    多语言问答数据集-TyDiQA可回答问题子集 数据来源:互联网公开数据 标签:自然语言处理,NLP,问答系统,机器阅读理解,多语言,文本数据,AI,语言学,TydiQA,Hugging Face 数据概述: Answerable-TyDiQA数据集是TyDi QA数据集的子集,TyDi QA是一个涵盖11种语言的问答数据集。Answerable-...
    packageimg
  • 命名实体识别数据集NER-meharihailemariam

    2025年4月26日   

    命名实体识别数据集NER-meharihailemariam 数据来源:互联网公开数据 标签:自然语言处理,命名实体识别,数据集,文本分析,机器学习,信息抽取,语言学,文本标注 数据概述: 该数据集包含用于命名实体识别(NER)任务的文本数据,记录了文本中各种命名实体的详细信息。主要特征如下: 时间跨度:...
    packageimg
  • 语法修正说服文本数据集Grammar-CorrectedPersuasiveTextDataset2023-defdet

    2025年4月26日   

    语法修正说服文本数据集Grammar-CorrectedPersuasiveTextDataset2023-defdet 数据来源:互联网公开数据 标签:语法修正,说服文本,自然语言处理,文本分析,机器学习,语言学,数据集,文本生成 数据概述: 该数据集包含经过语法修正的说服性文本数据,适用于自然语言处理和文本生成等任务。主要特征如下:...
    packageimg
  • 词语难度评估数据集DifficultiesofWordsDataset-natsumii

    2025年4月26日   

    词语难度评估数据集DifficultiesofWordsDataset-natsumii 数据来源:互联网公开数据 标签:语言学习,词汇难度,数据集,教育技术,自然语言处理,语言学,文本分析,认知科学 数据概述: 该数据集包含来自语言学研究领域的词语难度评估数据,记录了不同词语的难度等级及相关特征。主要特征如下:...
    packageimg
  • 数据5000语料树结构数据集5000ConstituencyandDependencyTreesDataset-pragyanshusingh01

    2025年4月26日   

    5000语料树结构数据集5000ConstituencyandDependencyTreesDataset-pragyanshusingh01 数据来源:互联网公开数据 标签:语料库,句法分析,依存句法,数据集,自然语言处理,人工智能,语言学,计算机科学...
    packageimg
  • 孟加拉语文本摘要模型数据集BanglaTextSummarizationModelDataset-devtousif

    2025年4月26日   

    孟加拉语文本摘要模型数据集BanglaTextSummarizationModelDataset-devtousif 数据来源:互联网公开数据 标签:文本摘要,自然语言处理,数据集,机器学习,深度学习,语言学,机器翻译,人工智能 数据概述: 该数据集包含来自互联网公开资源的孟加拉语文本及其对应的摘要,主要用于文本摘要生成模型的训练和评估。主要特征如下:...
    packageimg