找到963个数据集

标签: 语言学

过滤结果
  • 西班牙推特暗示抑郁数据集

    2025年4月15日   

    西班牙推特暗示抑郁数据集 数据来源:互联网公开数据 标签:抑郁,推特,社交媒体,心理健康,情感分析,语言学,行为分析 数据概述: 本数据集包含1000条由90名不同用户发布的西班牙语推特,这些推特暗示了抑郁的迹象。数据集中的推特经过人工筛选和整理,旨在用于检测和分析西班牙语推特中抑郁症状的迹象。 数据用途概述:...
    packageimg
  • 旁遮普语沙木基语料库词频统计数据集

    2025年4月15日   

    旁遮普语沙木基语料库词频统计数据集 数据来源:互联网公开数据 标签:旁遮普语,沙木基语,语言学,词频统计,文本分析,自然语言处理,语料库 数据概述: 本数据集基于从互联网收集的旁遮普语沙木基语料库构建而成,包含单字词(unigram)和双字词(bigram)的频率统计信息。 数据文件包括: unigram-p.csv:包含50,000个单字词及其词频。...
    packageimg
  • 英语短语和谚语数据集

    2025年4月15日   

    英语短语和谚语数据集 数据来源:互联网公开数据 标签:英语短语,谚语,语言学,文化研究,教育,翻译 数据概述: 本数据集包含数千条英语短语和谚语,涵盖了日常表达、文化背景和智慧格言等多个方面。数据集适合用于语言学研究、文化分析、教育和翻译等多种场景。 数据用途概述:...
    packageimg
  • 俄罗斯版Esquire杂志-我学到的-访谈语录数据集

    2025年4月15日   

    俄罗斯版Esquire杂志-我学到的-访谈语录数据集 数据来源:互联网公开数据 标签:Esquire,访谈,语录,俄罗斯,名人,文化,语言学,文本分析 数据概述: 本数据集收录了俄罗斯版Esquire杂志“我学到的”系列访谈内容。该系列访谈汇集了各行各业名人的生活感悟和人生经验。数据集包含访谈原文,为俄语。 数据用途概述:...
    packageimg
  • 韩国语词汇频率数据集

    2025年4月15日   

    韩国语词汇频率数据集 数据来源:互联网公开数据 标签:词汇频率,韩国语,自然语言处理,NLP,词频统计,语言学,语料库,词根分析,借词研究 数据概述 本数据集由韩国国立国语研究院(National Institute of the Korean...
    packageimg
  • WordNet反义词数据集-2006

    2025年4月15日   

    WordNet反义词数据集-2006 数据来源:互联网公开数据 标签:反义词,WordNet,语言学,数据,词典,文本分析,自然语言处理 数据概述: 本数据集包含了从WordNet数据库版本3.0中提取的反义词数据。每个反义词组由至少一个反义词构成,不同反义词组之间用 "|" 分隔,同一组内的反义词用 ";"...
    packageimg
  • 摩洛哥方言-英语词汇对照数据集

    2025年4月15日   

    摩洛哥方言-英语词汇对照数据集 数据来源:互联网公开数据 标签:摩洛哥方言,英语,自然语言处理,NLP,词汇对照,方言研究,语言学 数据概述:...
    packageimg
  • 英语词汇综合列表数据集

    2025年4月15日   

    英语词汇综合列表数据集 数据来源:互联网公开数据 标签:英语词汇,自然语言处理,NLP,语言学,词汇库 数据概述: 本数据集包含超过416,000个独特的英语单词,涵盖了广泛的主题和领域,是一个全面的英语词汇列表。该数据集适用于多种自然语言处理任务、语言学研究和其他需要大量英语词汇的应用场景。 数据用途概述:...
    packageimg
  • 印度僧伽罗语歌曲与比喻数据集

    2025年4月15日   

    印度僧伽罗语歌曲与比喻数据集 数据来源:互联网公开数据 标签:僧伽罗语,歌曲,比喻,歌词分析,文化研究,语言学,文学 数据概述: 本数据集包含与僧伽罗语歌曲及其所用比喻相关的信息。数据涵盖了各类僧伽罗语歌曲的歌词、歌曲主题、使用的比喻及其含义等关键要素,为研究僧伽罗语文化和文学提供了丰富的语言材料。 数据用途概述:...
    packageimg
  • 波斯语文本蕴含推理数据集FarsTail

    2025年4月15日   

    波斯语文本蕴含推理数据集FarsTail 数据来源:互联网公开数据 标签:自然语言处理,文本蕴含,NLI,波斯语,波斯文,Farsi,数据集,机器翻译,语言学 数据概述:...
    packageimg
  • 英语到阿萨姆语平行语料库数据集

    2025年4月15日   

    英语到阿萨姆语平行语料库数据集 数据来源:互联网公开数据 标签:英语,阿萨姆语,平行语料库,自然语言处理,翻译,语言学 数据概述: 本数据集包含大量经过清理的英语到阿萨姆语平行语料库数据,适用于自然语言处理和机器翻译研究。数据集分为两部分:1_eng.txt 包含大量的英语句子,1_assamese.txt...
    packageimg
  • 讽刺文本情感分析语料库数据集V2-讽刺文本分类数据集

    2025年4月15日   

    讽刺文本情感分析语料库数据集V2-讽刺文本分类数据集 数据来源:互联网公开数据 标签:讽刺,情感分析,文本分类,自然语言处理,语料库,机器学习,社交媒体,语言学 数据概述:...
    packageimg
  • 波斯语拼写纠错数据集-FASpell数据集

    2025年4月15日   

    波斯语拼写纠错数据集-FASpell数据集 数据来源:互联网公开数据 标签:波斯语,Farsi,拼写纠错,自然语言处理,NLP,语言学,文本校对,教育,机器学习 数据概述:...
    packageimg
  • 波兰手语数据集

    2025年4月14日   

    波兰手语数据集 数据来源:互联网公开数据 标签:波兰手语,手势识别,机器学习,计算机视觉,语言学,模式识别,数据科学,波兰文化,手语研究 数据概述:...
    packageimg
  • 社交媒体仇恨言论识别数据集-文本内容-2017

    2025年4月14日   

    社交媒体仇恨言论识别数据集-文本内容-2017 数据来源:互联网公开数据 标签:仇恨言论,社交媒体,文本分析,情感分析,自然语言处理,语言学,数据标注,分类,攻击性语言 数据概述: 本数据集包含近1.5万条短文本,每条文本均由多位贡献者进行标注,以识别其是否包含仇恨言论。标注结果分为三类:a) 包含仇恨言论;b) 具有攻击性,但不属于仇恨言论;c)...
    packageimg
  • 韩国谚语与格言数据集

    2025年4月14日   

    韩国谚语与格言数据集 数据来源:互联网公开数据 标签:韩国谚语,韩国格言,文化遗产,文化研究,语言学,社会学 数据概述: 本数据集包含了丰富的韩国谚语与格言,涵盖了从古代到现代的广泛时期。数据集中的每一条谚语或格言都提供了其意义、来源以及类型(如俗语、成语等)的详细说明,为研究韩国语言文化和社会习俗提供了宝贵资源。 数据用途概述:...
    packageimg
  • 阿拉伯语仇恨言论检测数据集-42k

    2025年4月14日   

    阿拉伯语仇恨言论检测数据集-42k 数据来源:互联网公开数据 标签:阿拉伯语,仇恨言论,社交媒体,文本分析,自然语言处理,情感分析,语言学,机器学习 数据概述: 本数据集包含超过42,000条阿拉伯语文本数据,主要来源于社交媒体平台。 数据集旨在为研究和开发阿拉伯语仇恨言论检测模型提供支持。...
    packageimg
  • 德语词汇列表数据集

    2025年4月14日   

    德语词汇列表数据集 数据来源:互联网公开数据 标签:德语词汇,语言学,语料库,书籍,文本分析,教育,研究 数据概述: 本数据集收录了11本德语书籍的文本内容,总计超过3000页。数据集中只包含一个字段,为德语词汇列表。这些书籍来源于互联网资源,包括DOABooks和USP E-Disciplinas平台上的相关文档。 数据用途概述:...
    packageimg
  • 葡萄牙语单复数数据库

    2025年4月14日   

    葡萄牙语单复数数据库 数据来源:互联网公开数据 标签:葡萄牙语,单复数,语言学,词汇,数据分析,教育,词典 数据概述:...
    packageimg
  • 瓦尔米基罗摩衍那梵文数据集

    2025年4月14日   

    瓦尔米基罗摩衍那梵文数据集 数据来源:互联网公开数据 标签:梵文,印度史诗,瓦尔米基,罗摩衍那,神话,文学,印度文化,语言学,历史 数据概述:...
    packageimg