-
俄罗斯单词重音预测数据集-williamsutcliffe
俄罗斯单词重音预测数据集-williamsutcliffe 数据来源:互联网公开数据 标签:俄罗斯,重音,语言学,深度学习,RNN,Transformer,字符标记化,语音学 数据概述:... -
古兰经阿拉伯语词根数据集-mazharkarimi
古兰经阿拉伯语词根数据集-mazharkarimi 数据来源:互联网公开数据 标签:古兰经,阿拉伯语,词根,语言学,文本分析,自然语言处理,宗教研究,语义分析 数据概述: 该数据集包含了古兰经中出现的阿拉伯语词根信息。主要特征如下: 时间跨度: 数据记录的时间范围为古兰经的创作时期。 地理范围: 数据涵盖了古兰经文本中使用的所有阿拉伯语词根。... -
柬埔寨公共工程与运输部MPWT高棉语语音数据集-sovanndaradiep
柬埔寨公共工程与运输部MPWT高棉语语音数据集-sovanndaradiep 数据来源:互联网公开数据 标签:语音识别,高棉语,数据集,语音信号处理,自然语言处理,声学模型,语音合成,语言学 数据概述: 该数据集包含来自柬埔寨公共工程与运输部(MPWT)的高棉语语音数据,旨在用于语音识别,语音合成等研究。主要特征如下:... -
CommonLit文本阅读理解训练数据集CommonLitReadabilityPrizeDataset-mcpenguin
CommonLit文本阅读理解训练数据集CommonLitReadabilityPrizeDataset-mcpenguin 数据来源:互联网公开数据 标签:文本分析,阅读理解,自然语言处理,教育,数据集,机器学习,文本难度,语言学 数据概述: 该数据集包含CommonLit公司提供的文本阅读理解训练数据,旨在评估文本的可读性和难度。主要特征如下:... -
自然语言处理特征工程数据集FeatureEngineeringforNLPDataAcquisition-ebaruti
自然语言处理特征工程数据集FeatureEngineeringforNLPDataAcquisition-ebaruti 数据来源:互联网公开数据 标签:自然语言处理,特征工程,数据集,文本分析,机器学习,语言学,数据科学,人工智能... -
越南语停用词数据集VLSPStopwordsVietnameseDataset-phttrnnguyngia
越南语停用词数据集VLSPStopwordsVietnameseDataset-phttrnnguyngia 数据来源:互联网公开数据 标签:自然语言处理,文本分析,停用词,越南语,数据集,语言学,文本挖掘,信息检索 数据概述: 该数据集包含了越南语的停用词列表,旨在帮助文本处理和自然语言处理任务。主要特征如下:... -
讽刺文本检测数据集-raviutsavk
讽刺文本检测数据集-raviutsavk 数据来源:互联网公开数据 标签:文本分析,情感分析,讽刺检测,自然语言处理,机器学习,数据集,社交媒体,语言学 数据概述: 该数据集包含了用于讽刺文本检测的数据,记录了带有讽刺意味的文本及其对应的标签。主要特征如下: 时间跨度:数据记录的时间范围不限,涵盖了不同时期和类型的讽刺文本。... -
爱尔兰古语与中古爱尔兰语语料库数据集-noahsullivan
爱尔兰古语与中古爱尔兰语语料库数据集-noahsullivan 数据来源:互联网公开数据 标签:语料库,古语,中古爱尔兰语,自然语言处理,词典,语言学,历史,文化,文本分析 数据概述: 本数据集为《爱尔兰古语与中古爱尔兰语语料库》(Corpus PalaeoHibernicum,... -
矮人要塞游戏虚构语言名词词汇数据集-jerimee
矮人要塞游戏虚构语言名词词汇数据集-jerimee 数据来源:互联网公开数据 标签:矮人要塞,游戏,语言学,名词,词汇,虚构语言,矮人语,精灵语,地精语,人类语 数据概述: 本数据集收录了矮人要塞(Dwarf Fortress)游戏中使用的虚构语言名词词汇,这些词汇主要用于游戏内的人物、地点和区域命名。数据来源于DF-... -
威尔士语词典语料库词汇及语境分析数据集-rtatman
威尔士语词典语料库词汇及语境分析数据集-rtatman 数据来源:互联网公开数据 标签:威尔士语,词典,语言学,语料库,词汇,语言分析,凯尔特语,翻译,双语,单语 数据概述:... -
索马里语文本语料库-清洗后句子数据集-hassen7
索马里语文本语料库-清洗后句子数据集-hassen7 数据来源:互联网公开数据 标签:索马里语,语言学,文本数据,自然语言处理,句子,清洗,语料库 数据概述:... -
斯瓦希里语句子标注数据集-2023-hassen7
斯瓦希里语句子标注数据集-2023-hassen7 数据来源:互联网公开数据 标签:斯瓦希里语,句子标注,自然语言处理,文本分析,语言学,数据集,语料库 数据概述:... -
达里贾-英-阿拉伯语语言学数据集1963-2021-aminemontasir
达里贾-英-阿拉伯语语言学数据集1963-2021-aminemontasir 数据来源:互联网公开数据 标签:达里贾,阿拉伯语,英语,翻译,语言学,语法,动词变位,冠词确定,复数形式 数据概述:... -
英语维基词典未链接泰米尔语的罗马头衔词汇数据集-neechalkaran
英语维基词典未链接泰米尔语的罗马头衔词汇数据集-neechalkaran 数据来源:互联网公开数据 标签:英语,词汇,罗马,头衔,Wiktionary,语言学,词典,术语,未链接,泰米尔语 数据概述:... -
乌克兰语情感分析调查问卷回复数据集-annzhukova340
乌克兰语情感分析调查问卷回复数据集-annzhukova340 数据来源:互联网公开数据 标签:乌克兰语,情感分析,文本分类,自然语言处理,调查数据,情感标签,机器学习,语言学 数据概述: 本数据集包含了18,000份以乌克兰语书写的调查问卷回复。 数据集经过平衡处理,包含: 9,000份正面回复 9,000份负面回复 每条记录由两部分组成:... -
常用英语词性与名词复数形式数据集-2023-thedevastator
常用英语词性与名词复数形式数据集-2023-thedevastator 数据来源:互联网公开数据 标签:英语,词性,名词,复数形式,语言学,教育,研究,语法 数据概述:... -
绕口令数据集-英文绕口令集合-2023-djathidiro
绕口令数据集-英文绕口令集合-2023-djathidiro 数据来源:互联网公开数据 标签:绕口令,语言学,机器学习,自然语言处理,数据集,开源,贡献,教育,娱乐,语言技能 数据概述:... -
韩国方言词典数据集-2023-daraejang
韩国方言词典数据集-2023-daraejang 数据来源:互联网公开数据 标签:韩国,方言,词典,语言学,官方数据,国民语言研究所,CC BY-SA 2.0 数据概述:... -
葡萄牙语推特仇恨言论数据集-2019-hrmello
葡萄牙语推特仇恨言论数据集-2019-hrmello 数据来源:互联网公开数据 标签:仇恨言论,葡萄牙语,推特,文本分类,自然语言处理,情感分析,机器学习,社交媒体,语言学 数据概述:... -
乌尔都语句子数据集-2023年-sheerazhussain
乌尔都语句子数据集-2023年-sheerazhussain 数据来源:互联网公开数据 标签:乌尔都语,句子,语言学,文本分析,自然语言处理,语言数据 数据概述: 本数据集包含一小部分乌尔都语句子,适合用于语言学研究、文本分析和自然语言处理任务。数据集中的句子涵盖了乌尔都语的多种语言特征和语法结构,为研究人员提供了基础的语言数据资源。 数据用途概述:...