-
孟加拉语语音转录数据集BengaliSpeechTranscriptionDataset-rafihassan
孟加拉语语音转录数据集BengaliSpeechTranscriptionDataset-rafihassan 数据来源:互联网公开数据 标签:语音识别, 语音转录, 孟加拉语, 语言学, 语音学, 声学, 数据标注, 自然语言处理 数据概述:... -
斯瓦希里语语料库数据集-kariukiandrew
斯瓦希里语语料库数据集-kariukiandrew 数据来源:互联网公开数据 标签:斯瓦希里语,语料库,自然语言处理,文本分析,语言学,机器翻译,文本挖掘,非洲语言 数据概述: 该数据集包含斯瓦希里语文本语料,旨在为自然语言处理和语言学研究提供资源。主要特征如下: 时间跨度:数据涵盖不同时期和来源的斯瓦希里语文本。... -
白俄罗斯语诗歌情感分析数据集BelarusianPoetrySentimentAnalysis-aliaksandrak
白俄罗斯语诗歌情感分析数据集BelarusianPoetrySentimentAnalysis-aliaksandrak 数据来源:互联网公开数据 标签:诗歌, 白俄罗斯语, 情感分析, 文本分析, 自然语言处理, 语言学, 文化研究, 诗歌鉴赏 数据概述:... -
孟加拉语文本翻译数据集BengaliTextTranslationDataset-vihaanagrawal
孟加拉语文本翻译数据集BengaliTextTranslationDataset-vihaanagrawal 数据来源:互联网公开数据 标签:机器翻译, 文本分析, 孟加拉语, 语言学, 自然语言处理, 语料库, 文本预处理, 语言模型 数据概述: 该数据集包含来自互联网的孟加拉语文本片段,记录了用于机器翻译训练的孟加拉语文本。主要特征如下:... -
英语写作错误纠正与评分数据集EnglishEssayErrorCorrectionandScoring-sparkleluo
英语写作错误纠正与评分数据集EnglishEssayErrorCorrectionandScoring-sparkleluo 数据来源:互联网公开数据 标签:英语写作, 文本纠错, 评分预测, 自然语言处理, 语言学, 机器学习, 错误检测, 教育 数据概述:... -
古兰经经文英阿对照数据集QuranicVersesEnglish-ArabicDataset-zohaib1111
古兰经经文英阿对照数据集QuranicVersesEnglish-ArabicDataset-zohaib1111 数据来源:互联网公开数据 标签:古兰经, 阿拉伯语, 英语翻译, 文本数据, 宗教研究, 语言学, 文本分析, 语料库 数据概述: 该数据集包含来自公开渠道的古兰经经文,提供了阿拉伯原文及其对应的英文翻译。主要特征如下:... -
越南语-占语词汇对照数据集Vietnamese-ChamVocabularyDataset-tuongdang
越南语-占语词汇对照数据集Vietnamese-ChamVocabularyDataset-tuongdang 数据来源:互联网公开数据 标签:语言学, 词汇对照, 越南语, 占语, 少数民族语言, 语言翻译, 文本分析, 词典编纂 数据概述:... -
乌尔都语情感分析数据集RomanUrduSentimentAnalysisDataset-owaisraza009
乌尔都语情感分析数据集RomanUrduSentimentAnalysisDataset-owaisraza009 数据来源:互联网公开数据 标签:情感分析, 乌尔都语, 文本分类, 社交媒体, 自然语言处理, 情感极性, 语言学, 数据标注 数据概述: 该数据集包含来自社交媒体平台的乌尔都语评论,记录了用户对于不同话题的情感倾向。主要特征如下:... -
心理咨询师访谈对话数据集PsychotherapistInterviewDialogueDataset-kavyasreeande
心理咨询师访谈对话数据集PsychotherapistInterviewDialogueDataset-kavyasreeande 数据来源:互联网公开数据 标签:心理咨询, 访谈对话, 文本分析, 情绪识别, 行为分析, 医疗健康, 语言学, 机器学习 数据概述:... -
萨米语文本分析数据集SamiLanguageTextAnalysis-annanet
萨米语文本分析数据集SamiLanguageTextAnalysis-annanet 数据来源:互联网公开数据 标签:萨米语, 文本分析, 语言学, 语料库, 文本挖掘, 自然语言处理, 少数民族语言, 文本语料 数据概述: 该数据集包含来自萨米语文本的数据,记录了萨米语的语言文字内容。主要特征如下:... -
印地语-英语翻译数据集Hindi-EnglishTranslationDataset-aryaumesh
印地语-英语翻译数据集Hindi-EnglishTranslationDataset-aryaumesh 数据来源:互联网公开数据 标签:机器翻译, 语言学, 印地语, 英语, 翻译模型, 双语对照, 文本数据, 自然语言处理 数据概述: 该数据集包含来自互联网的英语-印地语翻译对照数据,记录了英语短语或单词及其对应的印地语翻译。主要特征如下:... -
中文词频统计分析数据集ChineseWordFrequencyStatistics-danphan2012
中文词频统计分析数据集ChineseWordFrequencyStatistics-danphan2012 数据来源:互联网公开数据 标签:中文, 词频分析, 自然语言处理, 文本挖掘, 语料库, 统计分析, 语言学, 数据集 数据概述: 该数据集包含来自公开语料库的中文文本数据,记录了词语及其对应的出现频率。主要特征如下:... -
印地语-英语平行语料翻译数据集Hindi-EnglishParallelCorpus-jayk00
印地语-英语平行语料翻译数据集Hindi-EnglishParallelCorpus-jayk00 数据来源:互联网公开数据 标签:机器翻译, 文本翻译, 语料库, 印地语, 英语, 自然语言处理, 语言学, 双语数据 数据概述: 该数据集包含来自未知来源的印地语-英语平行语料,记录了印地语文本及其对应的英语翻译。主要特征如下:... -
印地语词汇翻译数据集HindiVocabularyTranslationDataset-omkartt
印地语词汇翻译数据集HindiVocabularyTranslationDataset-omkartt 数据来源:互联网公开数据 标签:机器翻译, 词汇翻译, 印地语, 文本数据, 自然语言处理, 语言学, 数据集, 词汇对照 数据概述: 该数据集包含来自互联网的印地语词汇及其对应的翻译。主要特征如下:... -
印地语词汇翻译对照数据集HindiVocabularyTranslationDataset-sriramgugulothu
印地语词汇翻译对照数据集HindiVocabularyTranslationDataset-sriramgugulothu 数据来源:互联网公开数据 标签:印地语, 词汇翻译, 文本数据, 语言学, 机器翻译, 自然语言处理, 数据集, 文本分析 数据概述:... -
阿拉伯语隐喻识别数据集ArabicMetaphorDetectionDataset-linahabuhajar
阿拉伯语隐喻识别数据集ArabicMetaphorDetectionDataset-linahabuhajar 数据来源:互联网公开数据 标签:隐喻检测,自然语言处理,文本分类,阿拉伯语,情感分析,语料库,机器学习,语言学 数据概述: 该数据集包含来自多个来源的阿拉伯语文本,主要用于阿拉伯语文本中的隐喻识别任务。主要特征如下:... -
维基百科中文语句数据集-terrychanorg
维基百科中文语句数据集-terrychanorg 数据来源:互联网公开数据 标签:维基百科,中文,语句数据,自然语言处理,文本分析,语言学,数据集 数据概述: 本数据集包含从维基百科中文版提取的1258282句语句数据。这些语句涵盖了广泛的主题和领域,包括但不限于历史、科学、技术、文化和社会。数据集旨在为自然语言处理和文本分析提供丰富的语料库资源。... -
印度语地名识别标注数据集HindiNamedEntityRecognitionDataset-vishal19217
印度语地名识别标注数据集HindiNamedEntityRecognitionDataset-vishal19217 数据来源:互联网公开数据 标签:自然语言处理, 命名实体识别, 地名识别, 印度语, 文本标注, 语言学, 机器学习, 文本分析 数据概述: 该数据集包含来自印度语文本的数据,记录了经过标注的句子,用于识别其中的地名实体。主要特征如下:... -
突尼斯方言文本情感分析数据集TunisianDialectsTextSentimentAnalysis-ghaithkhlifi
突尼斯方言文本情感分析数据集TunisianDialectsTextSentimentAnalysis-ghaithkhlifi 数据来源:互联网公开数据 标签:突尼斯方言,情感分析,文本分类,自然语言处理,方言识别,社交媒体,语言学,机器学习 数据概述:... -
日语词汇频率统计数据集JapaneseWordFrequencyStatistics-takashitahara
日语词汇频率统计数据集JapaneseWordFrequencyStatistics-takashitahara 数据来源:互联网公开数据 标签:日语, 词频分析, 语言学, 词汇, 自然语言处理, 文本分析, 语料库, 统计 数据概述: 该数据集包含来自公开语料库的日语词汇频率统计数据,记录了日语词汇的出现频率及其排名信息。主要特征如下:...