-
波斯语命名实体识别数据集PersianNamedEntityRecognitionDataset-yaserfathihour
波斯语命名实体识别数据集PersianNamedEntityRecognitionDataset-yaserfathihour 数据来源:互联网公开数据 标签:命名实体识别, 自然语言处理, 波斯语, 文本标注, 机器学习, 语料库, 语言模型, 文本分析 数据概述:... -
对话问答数据集ConversationQuestion-AnswerDataset-houzeker
对话问答数据集ConversationQuestion-AnswerDataset-houzeker 数据来源:互联网公开数据 标签:对话, 问答, 文本数据, 自然语言处理, 语义理解, 语言模型, 数据标注, 语料库 数据概述: 该数据集包含来自互联网的对话问答数据,记录了对话的提问与回答内容,适用于训练和评估对话系统、问答系统等。主要特征如下:... -
教育领域在线学习文本数据集EducationOnlineLearningTextDataset-dhrubajyotiguha15
教育领域在线学习文本数据集EducationOnlineLearningTextDataset-dhrubajyotiguha15 数据来源:互联网公开数据 标签:在线学习, 教育, 文本分析, 写作评估, 语言模型, 文本生成, 写作质量, 数据集 数据概述: 该数据集包含来自教育领域的文本数据,记录了学生关于在线学习主题的写作内容。主要特征如下:... -
俄英双语翻译句子对数据集Russian-EnglishSentencePairs-ligtfeather
俄英双语翻译句子对数据集Russian-EnglishSentencePairs-ligtfeather 数据来源:互联网公开数据 标签:机器翻译, 俄语, 英语, 文本对齐, 自然语言处理, 语言模型, 双语语料库, 语料库构建 数据概述: 该数据集包含俄语和英语的句子对,旨在用于机器翻译模型的训练和评估。主要特征如下:... -
文本摘要与风格分析数据集TextSummarizationandStyleAnalysisDataset-daominhkhanh
文本摘要与风格分析数据集TextSummarizationandStyleAnalysisDataset-daominhkhanh 数据来源:互联网公开数据 标签:文本摘要, 风格分析, 文本处理, 自然语言处理, 语言模型, 机器翻译, 文本分类, 数据集 数据概述:... -
日语分词器词汇表数据集JapaneseTokenizerVocabulary-watarukitagawa
日语分词器词汇表数据集JapaneseTokenizerVocabulary-watarukitagawa 数据来源:互联网公开数据 标签:日语分词, 词汇表, 文本处理, 自然语言处理, 词汇分析, 语言模型, 数据集, 词语ID 数据概述: 该数据集包含用于日语文本分词的词汇表数据,记录了日语单词及其对应的Token-ID。主要特征如下:... -
英语词汇频率统计分析数据集EnglishWordFrequencyStatisticsAnalysis-dabber1337
英语词汇频率统计分析数据集EnglishWordFrequencyStatisticsAnalysis-dabber1337 数据来源:互联网公开数据 标签:词频统计, 语言学, 语料库, 自然语言处理, 词汇分析, 文本数据, 语言模型, 英语 数据概述:... -
越南语命名实体识别数据集VietnameseNamedEntityRecognitionDataset-antrngphannh
越南语命名实体识别数据集VietnameseNamedEntityRecognitionDataset-antrngphannh 数据来源:互联网公开数据 标签:命名实体识别, 自然语言处理, 越南语, 文本标注, 语言模型, 文本分析, 数据集, 机器学习 数据概述:... -
诗歌文本改写与生成数据集PoetryTextRewritingandGenerationDataset-pratapsurwase
诗歌文本改写与生成数据集PoetryTextRewritingandGenerationDataset-pratapsurwase 数据来源:互联网公开数据 标签:诗歌, 文本生成, 文本改写, 自然语言处理, 创意写作, 诗歌分析, 语言模型, 数据集 数据概述: 该数据集包含来自pratapsurwase-gemma-... -
文本生成任务指令数据集TextGenerationTaskInstructionDataset-dhrubajyotiguha15
文本生成任务指令数据集TextGenerationTaskInstructionDataset-dhrubajyotiguha15 数据来源:互联网公开数据 标签:文本生成, 指令数据集, 自然语言处理, 文本指令, 深度学习, 数据集构建, 语言模型, 语料库 数据概述:... -
阿拉伯语问答对数据集ArabicQuestionPairsDataset-yanistouatiop
阿拉伯语问答对数据集ArabicQuestionPairsDataset-yanistouatiop 数据来源:互联网公开数据 标签:问答对, 阿拉伯语, 自然语言处理, 文本相似度, 机器翻译, 语义分析, 文本匹配, 语言模型 数据概述:... -
尼日利亚皮钦语文本数据集NigerianPidginTextDataset-harbidel
尼日利亚皮钦语文本数据集NigerianPidginTextDataset-harbidel 数据来源:互联网公开数据 标签:皮钦语, 文本语料库, 语言学, 自然语言处理, 文本分析, 语言模型, 情感分析, 文本挖掘 数据概述: 该数据集包含来自不同来源的尼日利亚皮钦语文本,记录了各种日常交流和新闻报道的语言实例。主要特征如下:... -
文本语言识别数据集TextLanguageDetectionDataset-tranlamtop
文本语言识别数据集TextLanguageDetectionDataset-tranlamtop 数据来源:互联网公开数据 标签:文本分析, 语言识别, 自然语言处理, 多语言, 文本分类, 机器学习, 语料库, 语言模型 数据概述: 该数据集包含来自不同来源的文本数据,记录了文本内容及其对应的语言标签,用于训练和评估语言识别模型。主要特征如下:... -
开放提示词数据集OpenPromptDataset-patriciaonggg
开放提示词数据集OpenPromptDataset-patriciaonggg 数据来源:互联网公开数据 标签:提示词, 文本生成, 自然语言处理, 机器学习, 文本分析, 创意写作, 语言模型, 数据标注 数据概述: 该数据集包含来自开放提示词项目的数据,记录了用于文本生成的提示词及其相关信息。主要特征如下:... -
语音转录文本测试数据集SpeechTranscriptionTextTestDataset-mohamedmotawie
语音转录文本测试数据集SpeechTranscriptionTextTestDataset-mohamedmotawie 数据来源:互联网公开数据 标签:语音识别, 语音转录, 文本分析, 声学模型, 语言模型, 机器翻译, 数据集, 语音处理 数据概述: 该数据集包含来自公开测试数据的语音转录文本,记录了语音文件与其对应的文本转录内容。主要特征如下:... -
医学文本蕴含关系越南语数据集MedicalTextualEntailmentVietnameseDataset-hoangnamne
医学文本蕴含关系越南语数据集MedicalTextualEntailmentVietnameseDataset-hoangnamne 数据来源:互联网公开数据 标签:文本蕴含, 自然语言处理, 医学, 越南语, 对抗关系, 文本推理, 语言模型, 数据标注 数据概述:... -
印地语机器阅读理解数据集HindiMachineReadingComprehensionDataset-anticeilac
印地语机器阅读理解数据集HindiMachineReadingComprehensionDataset-anticeilac 数据来源:互联网公开数据 标签:机器阅读理解, 自然语言处理, 文本问答, 印地语, 多语言, 文本理解, 数据集, 语言模型 数据概述:... -
孟加拉语母语问答数据集BanglaNativeQuestionAnsweringDataset-saniyatlamim007
孟加拉语母语问答数据集BanglaNativeQuestionAnsweringDataset-saniyatlamim007 数据来源:互联网公开数据 标签:问答系统, 自然语言处理, 孟加拉语, 文本生成, 语料库, 语言模型, 文本理解, 数据增强 数据概述:... -
文本连贯性与风格预测数据集TextCohesionandStylePredictionDataset-kunihikofurugori
文本连贯性与风格预测数据集TextCohesionandStylePredictionDataset-kunihikofurugori 数据来源:互联网公开数据 标签:文本分析, 写作风格, 连贯性, 语言模型, 机器学习, 自然语言处理, 文本特征, 预测模型 数据概述:... -
仇恨言论检测数据集HateSpeechDetectionDataset-hilloltabasshum
仇恨言论检测数据集HateSpeechDetectionDataset-hilloltabasshum 数据来源:互联网公开数据 标签:仇恨言论, 文本分类, 情感分析, 语言模型, 数据标注, 社交媒体, 机器学习, 语料库 数据概述: 该数据集包含来自社交媒体平台的文本数据,记录了用于检测仇恨言论的语句示例。主要特征如下:...