找到1,302个数据集

标签: 语料库

过滤结果
  • 罗马尼亚语维基源文学语料库1963-2021

    2025年4月15日   

    罗马尼亚语维基源文学语料库1963-2021 数据来源:互联网公开数据 标签:罗马尼亚文学,维基源,语料库,自然语言处理,机器学习,古典文学,文本分析 数据概述:...
    packageimg
  • 网络评论建设性分析语料库

    2025年4月15日   

    网络评论建设性分析语料库 数据来源:互联网公开数据 标签:网络评论,建设性分析,语料库,自然语言处理,机器学习,媒体互动,社会分析 数据概述: 本数据集为Constructive Comments Corpus (C3),包含12,000条评论数据,每条评论均经过人工标注,标注内容包括评论的建设性特征及其相关属性。该数据集是从Simon Fraser...
    packageimg
  • 讽刺文本情感分析语料库数据集V2-讽刺文本分类数据集

    2025年4月15日   

    讽刺文本情感分析语料库数据集V2-讽刺文本分类数据集 数据来源:互联网公开数据 标签:讽刺,情感分析,文本分类,自然语言处理,语料库,机器学习,社交媒体,语言学 数据概述:...
    packageimg
  • 泰语文本处理数据集

    2025年4月15日   

    泰语文本处理数据集 数据来源:互联网公开数据 标签:自然语言处理,泰语,文本分析,语料库,语言研究,机器学习,数据稀缺,创业生态,商业分析,投资趋势,行业分布 数据概述: 本数据集旨在支持泰语文本处理和自然语言处理(NLP)研究。数据集包含泰...
    packageimg
  • 英语语言学习者能力评估语料库1963-2021

    2025年4月15日   

    英语语言学习者能力评估语料库1963-2021 数据来源:互联网公开数据 标签:英语学习者,语言能力评估,写作样本,语料库,NLP,教育研究,评估方法 数据概述:...
    packageimg
  • 垃圾邮件过滤研究-SpamAssassin邮件数据集

    2025年4月14日   

    垃圾邮件过滤研究-SpamAssassin邮件数据集 数据来源:互联网公开数据 标签:垃圾邮件,SpamAssassin,邮件,文本分类,自然语言处理,机器学习,贝叶斯,语料库 数据概述:...
    packageimg
  • 阿尔巴尼亚方言语料库数据集2023

    2025年4月14日   

    阿尔巴尼亚方言语料库数据集2023 数据来源:互联网公开数据 标签:阿尔巴尼亚方言,语料库,社交媒体数据,地缘标签,机器学习,语言学研究 数据概述: 阿尔巴尼亚方言语料库数据集是由ERCAN CANHASI和REXHEP SHIJAKU基于《The Albanian Dialect...
    packageimg
  • 技能与职位描述语料库数据集

    2025年4月14日   

    技能与职位描述语料库数据集 数据来源:互联网公开数据 标签:技能,职位描述,自然语言处理,技能提取,机器学习,语料库,技能分析 数据概述: 本数据集基于大量职位描述数据构建,经过多轮数据清洗、格式标准化和预处理,最终形成了一套结构化、高质量的技能语料库。数据集包含了与技能相关的文本信息,适用于技能提取、技能分类、技能推荐等场景。 数据用途概述:...
    packageimg
  • 孟加拉语维基百科语料库数据集

    2025年4月14日   

    孟加拉语维基百科语料库数据集 数据来源:互联网公开数据 标签:孟加拉语,维基百科,自然语言处理,NLP,文本分析,机器学习,语料库 数据概述:...
    packageimg
  • PHINC-平行印地英混合语社交媒体语料库用于机器翻译

    2025年4月14日   

    PHINC-平行印地英混合语社交媒体语料库用于机器翻译 数据来源:互联网公开数据 标签:印地英混合语,机器翻译,社交媒体,代码混合,自然语言处理,多语言处理,语料库 数据概述:...
    packageimg
  • 德语词汇列表数据集

    2025年4月14日   

    德语词汇列表数据集 数据来源:互联网公开数据 标签:德语词汇,语言学,语料库,书籍,文本分析,教育,研究 数据概述: 本数据集收录了11本德语书籍的文本内容,总计超过3000页。数据集中只包含一个字段,为德语词汇列表。这些书籍来源于互联网资源,包括DOABooks和USP E-Disciplinas平台上的相关文档。 数据用途概述:...
    packageimg
  • 叔本华哲学研究著作文本数据集1774-1860

    2025年4月14日   

    叔本华哲学研究著作文本数据集1774-1860 数据来源:互联网公开数据 标签:叔本华,哲学,文本分析,NLP,语料库,德国古典哲学,时间序列 数据概述:...
    packageimg
  • 贝叶斯网络自然语言解释文本数据集

    2025年4月14日   

    贝叶斯网络自然语言解释文本数据集 数据来源:互联网公开数据 标签:贝叶斯网络,自然语言解释,可解释AI,文本分析,机器学习,语料库,语言学,解释生成 数据概述: 本数据集,即ExBAN语料库(Explanations for BAyesian...
    packageimg
  • 罗马尼亚语语法分析语料库1963-2021

    2025年4月14日   

    罗马尼亚语语法分析语料库1963-2021 数据来源:互联网公开数据 标签:罗马尼亚语,语料库,语法分析,自然语言处理,UD树库 数据概述: 本数据集是罗马尼亚语的通用依存树库(Universal Dependencies Romanian-...
    packageimg
  • 词汇语义与修辞手法数据集-词汇同义词与词频统计

    2025年4月14日   

    词汇语义与修辞手法数据集-词汇同义词与词频统计 数据来源:互联网公开数据 标签:词汇语义,同义词,修辞手法,词频统计,WordNet,自然语言处理,文本分析,语言学,语料库 数据概述:...
    packageimg
  • ELLIPSE英语学习者语料库

    2025年4月14日   

    ELLIPSE英语学习者语料库 数据来源:互联网公开数据 标签:英语学习者,语言能力评价,语料库,NLP,语言研究,教育评估,写作分析 数据概述:...
    packageimg
  • 普什图语翻译语料库

    2025年4月14日   

    普什图语翻译语料库 数据来源:互联网公开数据 标签:普什图语,阿富汗,巴基斯坦,在线社交网络,情感标注,翻译,语料库 数据概述:...
    packageimg
  • 爸爸笑话幽默语料库

    2025年4月14日   

    爸爸笑话幽默语料库 数据来源:互联网公开数据 标签:笑话,幽默,家庭,语言,语料库,娱乐,轻松一刻 数据概述: 本数据集收录了大量经典的爸爸笑话,涵盖各类搞笑的一 liners、双关语和幽默段子。数据集内容包括笑话文本、关键词提取以及分类标签,便于研究和应用。笑话内容以轻松幽默为主,适合家庭和社交场景,旨在为用户提供欢乐和轻松的体验。 数据用途概述:...
    packageimg
  • 电影对话语料库第二部分

    2025年4月14日   

    电影对话语料库第二部分 数据来源:互联网公开数据 标签:电影对话,语料库,自然语言处理,语音识别,时间标注,电影分析 数据概述:...
    packageimg
  • 斯洛文尼亚网络文本类型识别数据集-GINCO1-0训练-测试集

    2025年4月14日   

    斯洛文尼亚网络文本类型识别数据集-GINCO1-0训练-测试集 数据来源:互联网公开数据 标签:文本分类,自然语言处理,语料库,斯洛文尼亚语,网络文本,文本类型识别,机器学习,GINCO 1.0,语料 数据概述: 本数据集是基于斯洛文尼亚网络文本类型识别语料库GINCO 1.0构建的训练集和测试集,按照80:20的比例划分。GINCO...
    packageimg