-
英语和摩洛哥塔马兹格特与塔加拜勒特翻译数据集-thedevastator
英语和摩洛哥塔马兹格特与塔加拜勒特翻译数据集-thedevastator 数据来源:互联网公开数据 标签:翻译,英语,摩洛哥塔马兹格特,塔加拜勒特,数据集,机器翻译,语言学,教育 数据概述: 本数据集来源于Mozilla的Pontoon本地化平台,名为imone/ARB指令-... -
德语国际音标发音词典数据集GermanIPAPronunciationDictionaryDataset-cdminix
德语国际音标发音词典数据集GermanIPAPronunciationDictionaryDataset-cdminix 数据来源:互联网公开数据 标签:德语,发音,国际音标,词典,语言学,语音学,数据集,语音识别 数据概述:该数据集包含德语单词及其对应的国际音标(IPA)发音信息,旨在为德语语音研究和语音合成提供基础数据。主要特征如下:... -
聊天用语数据集ChatSlangDataset-muhammadbilal6305
聊天用语数据集ChatSlangDataset-muhammadbilal6305 数据来源:互联网公开数据 标签:聊天用语,社交媒体,数据集,自然语言处理,机器学习,文本分析,语言学,沟通研究 数据概述:该数据集包含来自社交媒体平台的聊天用语数据,记录了人们在聊天中使用的非正式语言,缩写和俚语。主要特征如下:... -
罗马乌尔都语文本数据集-akarami
罗马乌尔都语文本数据集-akarami 数据来源:互联网公开数据 标签:乌尔都语,罗马乌尔都语,文本数据,自然语言处理,语言学,数据集,机器学习,文本分析 数据概述: 该数据集包含了用罗马字母书写的乌尔都语文本。主要特征如下: 时间跨度:数据记录的时间范围不明确,但涵盖了现代乌尔都语的使用。... -
中文文本词频数据集TF-Word-FrequencyDataset-ludwing129
中文文本词频数据集TF-Word-FrequencyDataset-ludwing129 数据来源:互联网公开数据 标签:文本分析,词频统计,数据集,自然语言处理,语言学,机器学习,文本挖掘,中文处理 数据概述: 该数据集包含来自多个中文文本源的词频统计信息,记录了常见中文词汇在不同文本中的出现频率。主要特征如下:... -
命名实体识别数据集NamedEntityRecognitionDataset-muhammadabubakar627
命名实体识别数据集NamedEntityRecognitionDataset-muhammadabubakar627 数据来源:互联网公开数据 标签:命名实体识别,数据集,自然语言处理,文本分析,机器学习,信息提取,人工智能,语言学 数据概述: 该数据集包含来自互联网和公开文本资源的标注数据,记录了各种文本中的命名实体。主要特征如下: 时间跨度:... -
德里语言分布数据集DelhiLanguagesDataset-harshitsati
德里语言分布数据集DelhiLanguagesDataset-harshitsati 数据来源:互联网公开数据 标签:语言分布,人口统计,数据集,社会研究,数据分析,语言学,城市研究 数据概述: 该数据集包含来自德里地区的语言使用数据,记录了德里地区居民的主要语言使用情况。主要特征如下: 时间跨度:数据记录的时间范围从2011年到2021年。... -
印地文-英文双语数据集Hinglish-EnglishDataset-arpcode
印地文-英文双语数据集Hinglish-EnglishDataset-arpcode 数据来源:互联网公开数据 标签:双语数据集,语言学,自然语言处理,机器翻译,文本分析,数据集,印度语言,国际交流 数据概述:该数据集包含来自多个来源的印地文-英文双语数据,主要用于研究和开发印地文与英文之间的翻译和文本分析。主要特征如下:... -
自然语言处理词性标注数据集-gagnadrengur
自然语言处理词性标注数据集-gagnadrengur 数据来源:互联网公开数据 标签:词性标注,POS,自然语言处理,NLP,词法分析,语言学,文本分析 数据概述: 本数据集包含用于词性标注的参考数据,适用于自然语言处理中的词法分析。词性标注是指为文本中的每个词分配一个语法类别(词性),如名词、动词、形容词等。该数据集可用于训练和评估词性标注器的性能。... -
帕尔辛卢英语到波斯语翻译训练数据集ParsinluEnglishtoFarsiTranslationTrainDataset-nouriehmadanian
帕尔辛卢英语到波斯语翻译训练数据集ParsinluEnglishtoFarsiTranslationTrainDataset-nouriehmadanian 数据来源:互联网公开数据 标签:翻译数据集,英语到波斯语,自然语言处理,机器学习,数据科学,语言学,文本分析,人工智能 数据概述:... -
语言翻译数据集2010-2020数据集-amankumar2002
语言翻译数据集2010-2020数据集-amankumar2002 数据来源:互联网公开数据 标签:语言翻译,数据集,自然语言处理,机器学习,文本分析,语言学,多语言数据,文本翻译 数据概述:该数据集包含来自多个公开来源的语言翻译数据,记录了多种语言之间的翻译文本。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。... -
生物医学文本否定标注语料库-新冠药物治疗相关研究-ma7555
生物医学文本否定标注语料库-新冠药物治疗相关研究-ma7555 数据来源:互联网公开数据 标签:生物医学,文本挖掘,自然语言处理,否定检测,语料库,新冠,药物治疗,语言学 数据概述:... -
圣经文本数据集-vishnuprksh
圣经文本数据集-vishnuprksh 数据来源:互联网公开数据 标签:圣经,文本分析,自然语言处理,数据集,宗教研究,语言学,文本挖掘,语料库 数据概述:该数据集包含来自圣经的文本数据,涵盖了旧约和新约的多个版本和翻译。主要特征如下: 时间跨度:数据记录的时间跨度涵盖了圣经创作的整个时期,从公元前15世纪到公元1世纪。... -
命名实体识别数据集NERDataPS-NamedEntityRecognitionDataSet-hharshsharma2098
命名实体识别数据集NERDataPS-NamedEntityRecognitionDataSet-hharshsharma2098 数据来源:互联网公开数据 标签:命名实体识别,数据集,自然语言处理,文本挖掘,机器学习,人工智能,语言学,信息抽取... -
法国地理位置自然语言处理数据集FrenchLocationsNLPDataset-waelfezari
法国地理位置自然语言处理数据集FrenchLocationsNLPDataset-waelfezari 数据来源:互联网公开数据 标签:自然语言处理,地理位置,数据集,文本分析,机器学习,地理信息系统,语言学,信息检索 数据概述:该数据集包含来自互联网公开资源的法国地理位置相关文本数据,适用于自然语言处理,地理位置信息提取等任务。主要特征如下:... -
孟加拉语命名实体识别数据集-koushikdeb
孟加拉语命名实体识别数据集-koushikdeb 数据来源:互联网公开数据 标签:自然语言处理,命名实体识别,孟加拉语,数据集,语言学,文本分析,机器学习,NLP 数据概述: 该数据集包含孟加拉语文本,用于命名实体识别(NER)任务。主要特征如下: 时间跨度: 数据集未明确时间范围,但涵盖了不同年代和主题的文本。 地理范围:... -
乌尔都语数据集UrduDataSet-lucca9211
乌尔都语数据集UrduDataSet-lucca9211 数据来源:互联网公开数据 标签:乌尔都语,数据集,自然语言处理,文本分析,机器学习,语言学,学术资源,文化研究 数据概述:该数据集包含来自互联网和公开资源的乌尔都语文本数据,记录了乌尔都语的各类文本,适用于自然语言处理,文本分析等任务。主要特征如下:... -
汉语多模态语言处理与交互数据集-muhammadfaizan65
汉语多模态语言处理与交互数据集-muhammadfaizan65 数据来源:互联网公开数据 标签:语言学,认知科学,心理语言学,多模态,交互,眼动追踪,听觉刺激,视觉刺激,语言理解,语言生成,人工智能 数据概述:... -
阿拉伯语句子数据集ArabicSentencesDataset-ahmedtaha8889
阿拉伯语句子数据集ArabicSentencesDataset-ahmedtaha8889 数据来源:互联网公开数据 标签:阿拉伯语,自然语言处理,数据集,文本分析,机器翻译,语言模型,文本语料库,语言学 数据概述: 该数据集包含超过70万条阿拉伯语句子,旨在为自然语言处理(NLP)任务提供丰富的文本语料库。主要特征如下:... -
命名实体识别原始数据集NamedEntityRecognitionRawDataDataset-kiruthigaa
命名实体识别原始数据集NamedEntityRecognitionRawDataDataset-kiruthigaa 数据来源:互联网公开数据 标签:命名实体识别,数据集,自然语言处理,文本分析,机器学习,人工智能,语言学,文本挖掘 数据概述:该数据集包含来自多个来源的原始文本数据,记录了用于命名实体识别的任务。主要特征如下:...