-
孟加拉语文本分句与分割数据集BengaliTextSentenceSegmentationandSplitDataset-jjleesunny
孟加拉语文本分句与分割数据集BengaliTextSentenceSegmentationandSplitDataset-jjleesunny 数据来源:互联网公开数据 标签:孟加拉语, 文本处理, 分句, 文本分割, 自然语言处理, 语料库, 机器学习, 语言学 数据概述:... -
印地语-英语翻译词汇对照数据集English-MarathiTranslationVocabularyDataset-pushkarmorankar02
印地语-英语翻译词汇对照数据集English-MarathiTranslationVocabularyDataset-pushkarmorankar02 数据来源:互联网公开数据 标签:机器翻译, 语言学习, 词汇对照, 文本数据, 印地语, 英语, 语言学, 数据集 数据概述: 该数据集包含来自互联网的英语-... -
南非语文本多模态数据集SetswanaTextMultimodalDataset-rewardmathebula
南非语文本多模态数据集SetswanaTextMultimodalDataset-rewardmathebula 数据来源:互联网公开数据 标签:南非语, 文本分析, 多模态数据, 语言学, 文本分类, 机器学习, 自然语言处理, 数据标注 数据概述:... -
印度自然语言处理资源数据集IndicNLPResourcesDataset-arynamn
印度自然语言处理资源数据集IndicNLPResourcesDataset-arynamn 数据来源:互联网公开数据 标签:自然语言处理,印度语言,文本分析,数据集,机器学习,语言学,文化研究,多语言处理 数据概述:该数据集包含来自印度多个语言的文本资源,适用于自然语言处理和机器学习任务。主要特征如下:... -
越南语命名实体识别数据集VietnameseNamedEntityRecognitionDataset-sushii2512
越南语命名实体识别数据集VietnameseNamedEntityRecognitionDataset-sushii2512 数据来源:互联网公开数据 标签:自然语言处理, 命名实体识别, 越南语, 文本标注, 序列标注, 语言学, 机器学习, NLP 数据概述: 该数据集包含来自越南语文本的标注数据,用于训练和评估命名实体识别模型。主要特征如下:... -
社交媒体仇恨言论识别多任务数据集SocialMediaHateSpeechDetectionMulti-taskDataset-abhayshanbhag
社交媒体仇恨言论识别多任务数据集SocialMediaHateSpeechDetectionMulti-taskDataset-abhayshanbhag 数据来源:互联网公开数据 标签:仇恨言论, 文本分类, 多任务学习, 社交媒体, 自然语言处理, 情感分析, 标注数据, 语言学 数据概述:... -
英语写作质量评估训练数据集EnglishWritingQualityAssessmentTrainingDataset-baokaige
英语写作质量评估训练数据集EnglishWritingQualityAssessmentTrainingDataset-baokaige 数据来源:互联网公开数据 标签:英语写作, 文本评估, 语言学, 自然语言处理, 写作质量, 文本分析, 机器学习, 语篇分析 数据概述:... -
土耳其语文本冒犯性内容检测数据集TurkishTextOffensiveContentDetection-glzadeevni
土耳其语文本冒犯性内容检测数据集TurkishTextOffensiveContentDetection-glzadeevni 数据来源:互联网公开数据 标签:文本分类, 情感分析, 冒犯性语言, 仇恨言论, 语言学, 自然语言处理, 机器翻译, 语料库 数据概述:... -
英文文本词性标注数据集EnglishTextPart-of-SpeechTaggingDataset-hiuanh
英文文本词性标注数据集EnglishTextPart-of-SpeechTaggingDataset-hiuanh 数据来源:互联网公开数据 标签:词性标注, 自然语言处理, 文本分析, 语言学, 机器学习, 文本标注, 英文, 语料库 数据概述: 该数据集包含来自公开文本的英文单词及其对应的词性标注信息。主要特征如下:... -
越南语-高棉语平行语料数据集Vietnamese-KhmerParallelCorpus-nguyentronghuy
越南语-高棉语平行语料数据集Vietnamese-KhmerParallelCorpus-nguyentronghuy 数据来源:互联网公开数据 标签:机器翻译, 语言学, 越南语, 高棉语, 语料库, 平行语料, 文本翻译, 自然语言处理 数据概述: 该数据集包含越南语和高棉语的平行文本,旨在为机器翻译、跨语言研究等任务提供支持。主要特征如下:... -
阿拉伯语语音转录数据集ArabicSpeechTranscriptionDataset-yehiahany
阿拉伯语语音转录数据集ArabicSpeechTranscriptionDataset-yehiahany 数据来源:互联网公开数据 标签:语音识别, 阿拉伯语, 语音转录, 语音情感, 语音分析, 语言学, 声音, 数据集 数据概述: 该数据集包含阿拉伯语语音数据及其对应的文本转录。主要特征如下:... -
文学作品文本片段数据集LiteraryTextSnippets-vaishnavigoswami3
文学作品文本片段数据集LiteraryTextSnippets-vaishnavigoswami3 数据来源:互联网公开数据 标签:文本分析, 文学研究, 语料库, 自然语言处理, 文本挖掘, 语言学, 文本片段, 数据集 数据概述: 该数据集包含精选的文学作品文本片段,旨在为文本分析、自然语言处理等研究提供素材。主要特征如下:... -
命名实体识别新闻语料库NamedEntityRecognitionNewsCorpus-henry41148
命名实体识别新闻语料库NamedEntityRecognitionNewsCorpus-henry41148 数据来源:互联网公开数据 标签:命名实体识别, 自然语言处理, 文本标注, 语料库, 信息抽取, 机器学习, 文本分析, 语言学 数据概述: 该数据集包含来自新闻报道的文本数据,记录了经过人工标注的命名实体信息。主要特征如下:... -
泰卢固语仇恨言论检测数据集TeluguHateSpeechDetectionDataset-ui19co65
泰卢固语仇恨言论检测数据集TeluguHateSpeechDetectionDataset-ui19co65 数据来源:互联网公开数据 标签:仇恨言论, 泰卢固语, 文本分类, 情感分析, 语言学, 自然语言处理, 恶意内容检测, 数据标注 数据概述: 该数据集包含来自互联网的泰卢固语社交媒体评论,记录了用于识别仇恨言论的文本样本。主要特征如下:... -
印地语-英语平行语料翻译数据集Hindi-EnglishParallelCorpusTranslationDataset-swapanroy
印地语-英语平行语料翻译数据集Hindi-EnglishParallelCorpusTranslationDataset-swapanroy 数据来源:互联网公开数据 标签:机器翻译, 语料库, 印地语, 英语, 文本数据, 语言学, 双语对照, 自然语言处理 数据概述: 该数据集包含印地语-英语平行语料,记录了印地语和英语的句子对。主要特征如下:... -
自然语言处理项目文本数据集NLPDataProject-TextDataset-zafiransari12
自然语言处理项目文本数据集NLPDataProject-TextDataset-zafiransari12 数据来源:互联网公开数据 标签:自然语言处理,文本数据,数据集,机器学习,语言学,文本分析,文本挖掘,人工智能 数据概述:该数据集为自然语言处理项目的一部分,主要记录了用于训练和测试自然语言处理模型的文本数据。主要特征如下:... -
马达加斯加语语音识别数据集MalagasySpeechRecognitionDataset-misandratrarazafy
马达加斯加语语音识别数据集MalagasySpeechRecognitionDataset-misandratrarazafy 数据来源:互联网公开数据 标签:语音识别, 马达加斯加语, 声学模型, 语音转录, 深度学习, 语音数据集, 语言学, 音频数据 数据概述:... -
印地语词汇翻译对照数据集HindiVocabularyTranslationDataset-vivekreddybandi
印地语词汇翻译对照数据集HindiVocabularyTranslationDataset-vivekreddybandi 数据来源:互联网公开数据 标签:印地语, 词汇翻译, 文本数据, 机器翻译, 语言学, 数据集, 自然语言处理, 词典 数据概述: 该数据集包含印地语词汇与其对应的英文翻译,旨在促进印地语语言学习和机器翻译模型训练。主要特征如下:... -
多词表达歧义消解数据集Multi-WordExpressionDisambiguationDataset-ammadhasan
多词表达歧义消解数据集Multi-WordExpressionDisambiguationDataset-ammadhasan 数据来源:互联网公开数据 标签:自然语言处理, 文本分类, 歧义消解, 多词表达, 语料库, 语言学, 机器学习, 文本理解 数据概述:... -
阿拉伯语方言文本分类数据集ArabicDialectTextClassificationDataset-olaadelhussien
阿拉伯语方言文本分类数据集ArabicDialectTextClassificationDataset-olaadelhussien 数据来源:互联网公开数据 标签:阿拉伯语, 方言识别, 文本分类, 自然语言处理, 语言学, 机器学习, 语料库, 深度学习 数据概述:...