-
印度尼西亚至马来语桑巴斯翻译数据集
印度尼西亚至马来语桑巴斯翻译数据集 数据来源:互联网公开数据 标签:翻译,印度尼西亚语,马来语,桑巴斯语,语言学,自然语言处理,多语言数据集 数据概述: 本数据集包含印度尼西亚语句子及其在马来语(桑巴斯方言)中的翻译。数据集来源于公开的GitHub资源,涵盖了广泛的主题和内容,为语言学研究提供了丰富的语料库。 数据用途概述:... -
-
孟加拉语动词拆解数据集1963-2021
孟加拉语动词拆解数据集1963-2021 数据来源:互联网公开数据 标签:孟加拉语,动词拆解,词性标注,语言学,自然语言处理 数据概述: 本数据集收录了孟加拉语中的所有根动词,并将其映射到相应的词性标注。数据集为孟加拉语的语言学研究提供了基础性的词汇和语法资源。 数据用途概述:... -
西班牙推特暗示抑郁数据集
西班牙推特暗示抑郁数据集 数据来源:互联网公开数据 标签:抑郁,推特,社交媒体,心理健康,情感分析,语言学,行为分析 数据概述: 本数据集包含1000条由90名不同用户发布的西班牙语推特,这些推特暗示了抑郁的迹象。数据集中的推特经过人工筛选和整理,旨在用于检测和分析西班牙语推特中抑郁症状的迹象。 数据用途概述:... -
旁遮普语沙木基语料库词频统计数据集
旁遮普语沙木基语料库词频统计数据集 数据来源:互联网公开数据 标签:旁遮普语,沙木基语,语言学,词频统计,文本分析,自然语言处理,语料库 数据概述: 本数据集基于从互联网收集的旁遮普语沙木基语料库构建而成,包含单字词(unigram)和双字词(bigram)的频率统计信息。 数据文件包括: unigram-p.csv:包含50,000个单字词及其词频。... -
英语短语和谚语数据集
英语短语和谚语数据集 数据来源:互联网公开数据 标签:英语短语,谚语,语言学,文化研究,教育,翻译 数据概述: 本数据集包含数千条英语短语和谚语,涵盖了日常表达、文化背景和智慧格言等多个方面。数据集适合用于语言学研究、文化分析、教育和翻译等多种场景。 数据用途概述:... -
俄罗斯版Esquire杂志-我学到的-访谈语录数据集
俄罗斯版Esquire杂志-我学到的-访谈语录数据集 数据来源:互联网公开数据 标签:Esquire,访谈,语录,俄罗斯,名人,文化,语言学,文本分析 数据概述: 本数据集收录了俄罗斯版Esquire杂志“我学到的”系列访谈内容。该系列访谈汇集了各行各业名人的生活感悟和人生经验。数据集包含访谈原文,为俄语。 数据用途概述:... -
韩国语词汇频率数据集
韩国语词汇频率数据集 数据来源:互联网公开数据 标签:词汇频率,韩国语,自然语言处理,NLP,词频统计,语言学,语料库,词根分析,借词研究 数据概述 本数据集由韩国国立国语研究院(National Institute of the Korean... -
WordNet反义词数据集-2006
WordNet反义词数据集-2006 数据来源:互联网公开数据 标签:反义词,WordNet,语言学,数据,词典,文本分析,自然语言处理 数据概述: 本数据集包含了从WordNet数据库版本3.0中提取的反义词数据。每个反义词组由至少一个反义词构成,不同反义词组之间用 "|" 分隔,同一组内的反义词用 ";"... -
摩洛哥方言-英语词汇对照数据集
摩洛哥方言-英语词汇对照数据集 数据来源:互联网公开数据 标签:摩洛哥方言,英语,自然语言处理,NLP,词汇对照,方言研究,语言学 数据概述:... -
英语词汇综合列表数据集
英语词汇综合列表数据集 数据来源:互联网公开数据 标签:英语词汇,自然语言处理,NLP,语言学,词汇库 数据概述: 本数据集包含超过416,000个独特的英语单词,涵盖了广泛的主题和领域,是一个全面的英语词汇列表。该数据集适用于多种自然语言处理任务、语言学研究和其他需要大量英语词汇的应用场景。 数据用途概述:... -
印度僧伽罗语歌曲与比喻数据集
印度僧伽罗语歌曲与比喻数据集 数据来源:互联网公开数据 标签:僧伽罗语,歌曲,比喻,歌词分析,文化研究,语言学,文学 数据概述: 本数据集包含与僧伽罗语歌曲及其所用比喻相关的信息。数据涵盖了各类僧伽罗语歌曲的歌词、歌曲主题、使用的比喻及其含义等关键要素,为研究僧伽罗语文化和文学提供了丰富的语言材料。 数据用途概述:... -
波斯语文本蕴含推理数据集FarsTail
波斯语文本蕴含推理数据集FarsTail 数据来源:互联网公开数据 标签:自然语言处理,文本蕴含,NLI,波斯语,波斯文,Farsi,数据集,机器翻译,语言学 数据概述:... -
英语到阿萨姆语平行语料库数据集
英语到阿萨姆语平行语料库数据集 数据来源:互联网公开数据 标签:英语,阿萨姆语,平行语料库,自然语言处理,翻译,语言学 数据概述: 本数据集包含大量经过清理的英语到阿萨姆语平行语料库数据,适用于自然语言处理和机器翻译研究。数据集分为两部分:1_eng.txt 包含大量的英语句子,1_assamese.txt... -
讽刺文本情感分析语料库数据集V2-讽刺文本分类数据集
讽刺文本情感分析语料库数据集V2-讽刺文本分类数据集 数据来源:互联网公开数据 标签:讽刺,情感分析,文本分类,自然语言处理,语料库,机器学习,社交媒体,语言学 数据概述:... -
保加利亚诗歌数据集1963-2021
保加利亚诗歌数据集1963-2021 数据来源:互联网公开数据 标签:保加利亚诗歌,文本生成,作者分类,文学研究,语言学 数据概述: 本数据集收录了从Chitanka.info网站爬取的保加利亚诗歌,涵盖了多个时期的作品。数据以CSV文件格式存储在chitanka-... -
波斯语拼写纠错数据集-FASpell数据集
波斯语拼写纠错数据集-FASpell数据集 数据来源:互联网公开数据 标签:波斯语,Farsi,拼写纠错,自然语言处理,NLP,语言学,文本校对,教育,机器学习 数据概述:... -
-
社交媒体仇恨言论识别数据集-文本内容-2017
社交媒体仇恨言论识别数据集-文本内容-2017 数据来源:互联网公开数据 标签:仇恨言论,社交媒体,文本分析,情感分析,自然语言处理,语言学,数据标注,分类,攻击性语言 数据概述: 本数据集包含近1.5万条短文本,每条文本均由多位贡献者进行标注,以识别其是否包含仇恨言论。标注结果分为三类:a) 包含仇恨言论;b) 具有攻击性,但不属于仇恨言论;c)... -
韩国谚语与格言数据集
韩国谚语与格言数据集 数据来源:互联网公开数据 标签:韩国谚语,韩国格言,文化遗产,文化研究,语言学,社会学 数据概述: 本数据集包含了丰富的韩国谚语与格言,涵盖了从古代到现代的广泛时期。数据集中的每一条谚语或格言都提供了其意义、来源以及类型(如俗语、成语等)的详细说明,为研究韩国语言文化和社会习俗提供了宝贵资源。 数据用途概述:...