-
英语教学语料库数据集CompiledOnestopenglishCorpusDataset-orzhiang
英语教学语料库数据集CompiledOnestopenglishCorpusDataset-orzhiang 数据来源:互联网公开数据 标签:英语教学,语料库,语言研究,数据集,教育技术,自然语言处理,翻译研究,学术资源 数据概述: 该数据集包含来自Onestopenglish网站的英语教学语料库,记录了英语教学相关的文本内容。主要特征如下:... -
英语俚语词典数据集EnglishSlangDictionaryDataset-emreucar35
英语俚语词典数据集EnglishSlangDictionaryDataset-emreucar35 数据来源:互联网公开数据 标签:语言学,词典,俚语,词汇学,数据集,语言研究,文化研究,教育工具 数据概述: 该数据集包含来自公开资源整理的英语俚语词典数据,记录了英语俚语的词条,释义,使用场景及例句。主要特征如下:... -
越南语作文类别多标签分类数据集VietnameseEssayCategoriesMultilabelClassificationDataset-trnthinph
越南语作文类别多标签分类数据集VietnameseEssayCategoriesMultilabelClassificationDataset-trnthinph 数据来源:互联网公开数据 标签:自然语言处理,文本分类,多标签分类,越南语,作文分析,机器学习,教育技术,语言研究 数据概述:... -
俄罗斯越南语言数据集RussianVietnameseDataset-flightstar
俄罗斯越南语言数据集RussianVietnameseDataset-flightstar 数据来源:互联网公开数据 标签:语言学,自然语言处理,数据集,机器翻译,跨语言分析,人工智能,语言研究,文本分析 数据概述: 该数据集包含来自互联网公开资源的俄语和越南语语言数据,记录了两种语言的文本句子对,适用于机器翻译,语言学研究等任务。主要特征如下:... -
英语与印地语混合语料情感分析数据集HinglishDataforSentimentAnalysis-shivajeetrai
英语与印地语混合语料情感分析数据集HinglishDataforSentimentAnalysis-shivajeetrai 数据来源:互联网公开数据 标签:自然语言处理,情感分析,数据集,机器学习,语言研究,文本分类,多语言处理,数据挖掘 数据概述: 该数据集包含英语与印地语混合(Hinglish)的文本数据,主要用于情感分析任务。主要特征如下:... -
瑞典姓名数据集SvenskaNamnDataset-geeklund
瑞典姓名数据集SvenskaNamnDataset-geeklund 数据来源:互联网公开数据 标签:姓名,人口统计,数据集,语言研究,社会学,数据分析,瑞典,文化研究 数据概述:该数据集包含来自瑞典的姓名数据,记录了瑞典人口中的姓名使用情况。主要特征如下: 时间跨度:数据记录的时间范围从20世纪初到现代。... -
城市词典拼写变体数据集SpellingVariationonUrbanDictionaryDataset-paigema
城市词典拼写变体数据集SpellingVariationonUrbanDictionaryDataset-paigema 数据来源:互联网公开数据 标签:语言研究,数据集,拼写变体,词典学,自然语言处理,词汇学,文本分析,机器学习 数据概述: 该数据集包含来自城市词典(Urban... -
语音口音归档数据集SpeechAccentArchiveModifiedDataset-fotinipap
语音口音归档数据集SpeechAccentArchiveModifiedDataset-fotinipap 数据来源:互联网公开数据 标签:语音识别,口音分析,数据集,语言研究,机器学习,发音差异,音素分析,语音学 数据概述: 该数据集包含来自语音口音归档项目(Speech Accent... -
网络语言脏话数据集SwearTotalData-parkgarden
网络语言脏话数据集SwearTotalData-parkgarden 数据来源:互联网公开数据 标签:网络语言,脏话,文本分析,自然语言处理,数据集,社交媒体,文本挖掘,语言研究 数据概述:该数据集包含来自网络平台和社交媒体的脏话数据,记录了不同用户在各种网络场景下的脏话使用情况。主要特征如下: 时间跨度:数据记录的时间范围从2018年到2022年。... -
方言数据集DialectDataDataset-kitashinwtf
方言数据集DialectDataDataset-kitashinwtf 数据来源:互联网公开数据 标签:方言,语言学,数据集,语音识别,机器学习,自然语言处理,语言研究,文化研究 数据概述: 该数据集包含来自不同地区方言的语音和文本数据,记录了多种方言的发音,词汇和语法特征。主要特征如下: 时间跨度:数据记录的时间范围从近年到现代。... -
僧伽罗语新闻数据集SinhalaNewsDataset-virajtharinda
僧伽罗语新闻数据集SinhalaNewsDataset-virajtharinda 数据来源:互联网公开数据 标签:新闻数据,数据集,文本分析,自然语言处理,机器学习,语言研究,新闻媒体,信息提取 数据概述: 该数据集包含来自僧伽罗语新闻媒体的数据,记录了僧伽罗语新闻文章的详细信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。... -
印度手语数据集IndianSignLanguageDataset-sukhanshudukare
印度手语数据集IndianSignLanguageDataset-sukhanshudukare 数据来源:互联网公开数据 标签:印度手语,数据集,手势识别,计算机视觉,图像处理,机器学习,人工智能,语言研究 数据概述: 该数据集包含来自印度手语研究所的公开数据,记录了印度手语的视觉表达和手势动作。主要特征如下:... -
有毒评论分类数据集Assignment2ToxicCommentsDataset-uwugermi
有毒评论分类数据集Assignment2ToxicCommentsDataset-uwugermi 数据来源:互联网公开数据 标签:评论分析,数据集,机器学习,文本分类,自然语言处理,社交媒体,深度学习,语言研究 数据概述: 该数据集包含来自互联网上的用户评论数据,主要用于识别和分类有毒评论。主要特征如下:... -
情感色彩俄语词汇词典数据集DictionaryofEmotionallyChargedRussianWordsDataset-luchsmann
情感色彩俄语词汇词典数据集DictionaryofEmotionallyChargedRussianWordsDataset-luchsmann 数据来源:互联网公开数据 标签:词汇学,情感分析,俄语,数据集,语言研究,机器学习,情感语言学,自然语言处理 数据概述:... -
拉丁语语料库数据集CorpusLatinDataset-nerdofdot
拉丁语语料库数据集CorpusLatinDataset-nerdofdot 数据来源:互联网公开数据 标签:拉丁语,语料库,语言研究,古文献,自然语言处理,历史语言学,文本分析,古籍数字化 数据概述: 该数据集包含来自拉丁语文献的语料,记录了拉丁语在不同历史时期的文本内容。主要特征如下:... -
德语语法数据集GermanGrammarDataset-upamasarker
德语语法数据集GermanGrammarDataset-upamasarker 数据来源:互联网公开数据 标签:语言学,语法分析,数据集,自然语言处理,教育技术,机器学习,德语学习,语言研究 数据概述: 该数据集包含来自德语语法研究项目的数据,记录了德语语法规则和例句的详细信息。主要特征如下: 时间跨度:数据记录的时间范围从20世纪初到现代。... -
俄罗斯文本风格分类数据集RussianTextStyleClassificationDataset-lemkarik
俄罗斯文本风格分类数据集RussianTextStyleClassificationDataset-lemkarik 数据来源:互联网公开数据 标签:文本分类,自然语言处理,数据集,风格分析,机器学习,语言研究,情感分析,多语言处理 数据概述: 该数据集包含来自俄罗斯互联网公开来源的文本数据,记录了不同风格和语境下的文本样本。主要特征如下:... -
印地语歌曲歌词数据集HindiSongLyricsDataset-devitachi
印地语歌曲歌词数据集HindiSongLyricsDataset-devitachi 数据来源:互联网公开数据 标签:印地语,歌曲歌词,数据集,自然语言处理,文本分析,机器学习,音乐学,语言研究 数据概述: 该数据集包含来自印地语流行音乐作品的歌曲歌词数据,记录了印地语歌曲的歌词内容。主要特征如下: 时间跨度:数据记录的时间范围从20世纪到现代。... -
Kaggle写作数据集KaggleWrite-upDataDataset-ehsaasdhand
Kaggle写作数据集KaggleWrite-upDataDataset-ehsaasdhand 数据来源:互联网公开数据 标签:文本数据,写作分析,数据集,自然语言处理,机器学习,教育技术,语言研究,数据挖掘 数据概述: 该数据集包含来自Kaggle平台的用户写作数据,记录了用户在平台上提交的写作内容。主要特征如下:... -
阿拉伯语文章数据集ArabicArticleDataset-surayhan
阿拉伯语文章数据集ArabicArticleDataset-surayhan 数据来源:互联网公开数据 标签:阿拉伯语,文章,数据集,自然语言处理,文本分析,机器学习,语言研究,数据挖掘 数据概述: 该数据集包含来自互联网的阿拉伯语文本,记录了各类阿拉伯语文章的内容。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。...