-
孟加拉语文本纠错数据集BanglaTextCorrectionDataset-ajoydey00001
孟加拉语文本纠错数据集BanglaTextCorrectionDataset-ajoydey00001 数据来源:互联网公开数据 标签:文本纠错, 孟加拉语, 自然语言处理, 语言学, 错误检测, 数据清洗, 机器学习, 语料库 数据概述: 该数据集包含孟加拉语文本的纠错示例,记录了原始(错误)文本及其对应的正确文本。主要特征如下:... -
莎士比亚戏剧哈姆雷特英阿双语对白数据集Shakespeare-sHamletBilingualDialogue-mothecarpenter
莎士比亚戏剧哈姆雷特英阿双语对白数据集Shakespeare-sHamletBilingualDialogue-mothecarpenter 数据来源:互联网公开数据 标签:莎士比亚, 戏剧, 文本对齐, 双语语料库, 阿拉伯语, 英语, 语言学, 文本分析 数据概述:... -
孟加拉语语音转录数据集BengaliSpeechTranscriptionDataset-ibrahimkhalil09
孟加拉语语音转录数据集BengaliSpeechTranscriptionDataset-ibrahimkhalil09 数据来源:互联网公开数据 标签:语音识别, 语音转录, 孟加拉语, 语言学, 国际音标, 文本处理, 自然语言处理, 声学模型 数据概述:... -
印地语-英语翻译数据集Hindi-EnglishTranslationDataset-praskr
印地语-英语翻译数据集Hindi-EnglishTranslationDataset-praskr 数据来源:互联网公开数据 标签:机器翻译, 文本翻译, 印地语, 英语, 语言学, 自然语言处理, 双语语料库, 文本对齐 数据概述: 该数据集包含来自互联网的印地语-英语双语文本,记录了印地语句子及其对应的英语翻译。主要特征如下:... -
印地语-英语翻译文本数据集Hindi-EnglishTranslationDataset-sasikr
印地语-英语翻译文本数据集Hindi-EnglishTranslationDataset-sasikr 数据来源:互联网公开数据 标签:机器翻译, 文本翻译, 印地语, 英语, 语言学, 自然语言处理, 双语语料库, 文本对齐 数据概述: 该数据集包含来自公开来源的印地语-英语双语文本,记录了印地语文本及其对应的英语翻译。主要特征如下:... -
-
印尼语-英语1千词汇对照数据集-imroze
印尼语-英语1千词汇对照数据集-imroze 数据来源:互联网公开数据 标签:印尼语,英语,词汇,翻译,语言学,数据集,自然语言处理,双语词典 数据概述: 该数据集包含1000个印尼语单词及其对应的英语翻译。主要特征如下: 时间跨度:数据记录的时间范围为不确定,基于词汇的收集和整理。 地理范围:数据主要涉及印尼语和英语,涵盖印尼语常用词汇。... -
阿拉伯语方言数据集ArabiziDialectDataset-samawel97
阿拉伯语方言数据集ArabiziDialectDataset-samawel97 数据来源:互联网公开数据 标签:阿拉伯语,方言,语言学,数据集,文本分析,自然语言处理,机器学习,文化研究 数据概述:该数据集包含来自多个阿拉伯语国家和地区的信息,记录了阿拉伯语方言(Arabizi)的文本数据。主要特征如下:... -
英阿翻译数据集TranslationEnglishArabicDataset-yumnagamal
英阿翻译数据集TranslationEnglishArabicDataset-yumnagamal 数据来源:互联网公开数据 标签:机器翻译,英阿翻译,数据集,自然语言处理,文本分析,语言学,深度学习,NLP 数据概述: 该数据集包含英阿双语的翻译文本数据,记录了英语到阿拉伯语的翻译内容。主要特征如下: 时间跨度:... -
古兰经翻译阿塞拜疆语数据集TranslationoftheKoranintoAzerbaijaniDataset-vrashad
古兰经翻译阿塞拜疆语数据集TranslationoftheKoranintoAzerbaijaniDataset-vrashad 数据来源:互联网公开数据 标签:古兰经,翻译,阿塞拜疆语,宗教文本,数据集,语言学,文化研究,文本分析 数据概述:... -
常见拼写错误纠正数据集-therahasya00
常见拼写错误纠正数据集-therahasya00 数据来源:互联网公开数据 标签:拼写纠错,自然语言处理,数据集,文本校正,语言学,机器学习,文本处理,中文 数据概述: 该数据集包含常见的中文拼写错误及其对应的正确词汇。主要特征如下: 时间跨度:数据记录的时间范围无明确限定,持续更新和维护。 地理范围:数据主要涵盖中国大陆地区常用的中文词汇和表达。... -
巴西原住民语言词汇翻译数据集-joscaro
巴西原住民语言词汇翻译数据集-joscaro 数据来源:互联网公开数据 标签:语言学,原住民语言,词汇翻译,数据集,文化研究,自然语言处理,词典编纂,巴西 数据概述: 该数据集包含来自巴西原住民语言的词汇及其对应的翻译。主要特征如下: 时间跨度:数据记录的时间跨度取决于各语言的收集时间,涵盖不同时期。... -
越南语情感分析数据集VietnameseSentimentAnalysisDataset-vominhdat
越南语情感分析数据集VietnameseSentimentAnalysisDataset-vominhdat 数据来源:互联网公开数据 标签:情感分析,越南语,自然语言处理,文本分类,机器学习,情感极性,数据集,语言学 数据概述:该数据集包含来自越南语文本的情感标注数据,主要用于情感分析任务。主要特征如下:... -
摩洛哥达里贾语情感分析数据集-tariklemkadem
摩洛哥达里贾语情感分析数据集-tariklemkadem 数据来源:互联网公开数据 标签:情感分析,达里贾语,自然语言处理,文本挖掘,数据集,机器学习,摩洛哥文化,语言学 数据概述: 该数据集包含了摩洛哥达里贾语文本数据,用于情感分析任务。主要特征如下: 时间跨度: 数据集未明确标注具体的时间跨度,但数据采集的时间与摩洛哥社交媒体的活跃时间相关。... -
讽刺与嘲讽文本数据集IronyandSarcasmTextDataset-bce1298
讽刺与嘲讽文本数据集IronyandSarcasmTextDataset-bce1298 数据来源:互联网公开数据 标签:讽刺,嘲讽,情感分析,自然语言处理,文本数据,机器学习,情感识别,语言学 数据概述: 该数据集包含了标注了讽刺和嘲讽情感的文本数据,旨在用于情感分析和自然语言处理任务。主要特征如下:... -
数据2014年acl会议反讽识别数据集ACL2014IronyRecognitionDataset-akshit3050
2014年acl会议反讽识别数据集ACL2014IronyRecognitionDataset-akshit3050 数据来源:互联网公开数据 标签:自然语言处理,情感分析,数据集,反讽识别,机器学习,文本分类,语言学,情感计算 数据概述: 该数据集由2014年计算语言学协会(ACL)会议提供,专注于社交媒体文本中的反讽识别任务。主要特征如下:... -
乌尔都语字母数据集UrduAlphabetsDataset-farrukhk
乌尔都语字母数据集UrduAlphabetsDataset-farrukhk 数据来源:互联网公开数据 标签:乌尔都语,字母,数据集,图像识别,机器学习,文本分析,语言学,文化研究 数据概述: 该数据集包含乌尔都语字母的图像数据,旨在用于字母识别和相关语言学研究。主要特征如下: 时间跨度:数据记录的时间范围不明确,但包含了乌尔都语字母的静态图像。... -
海湾地区方言数据集GulfDialectsDataset-afifaalawami
海湾地区方言数据集GulfDialectsDataset-afifaalawami 数据来源:互联网公开数据 标签:方言研究,语音识别,自然语言处理,中东语言,文本分析,机器学习,文化研究,语言学 数据概述:该数据集包含来自海湾地区(包括沙特阿拉伯,阿联酋,科威特,卡塔尔,巴林和也门)的方言数据,记录了不同地区方言的语音和文本样本。主要特征如下:... -
土耳其方言数据集DialectsinTurkeyDataset-erdememinaa
土耳其方言数据集DialectsinTurkeyDataset-erdememinaa 数据来源:互联网公开数据 标签:方言研究,土耳其语言,数据集,自然语言处理,语言学,文化研究,语音识别,社会科学 数据概述:该数据集包含来自土耳其不同地区的方言数据,记录了土耳其各地域的方言特点和语音特征。主要特征如下:... -
印地语仇恨言论分析数据集-yash3056
印地语仇恨言论分析数据集-yash3056 数据来源:互联网公开数据 标签:仇恨言论,印地语,自然语言处理,文本分析,情感分析,社交媒体,数据集,语言学 数据概述: 该数据集包含来自社交媒体平台的印地语文本数据,旨在用于仇恨言论的检测和分析。主要特征如下: 时间跨度: 数据记录的时间范围,通常涵盖社交媒体平台上印地语文本发布的时间段。 地理范围:...