-
土耳其语问答数据集TurkishQuestionAnsweringDataset-mehmetberatersari
土耳其语问答数据集TurkishQuestionAnsweringDataset-mehmetberatersari 数据来源:互联网公开数据 标签:问答系统, 自然语言处理, 文本理解, 土耳其语, 机器阅读, 信息检索, 语言模型, 知识问答 数据概述:... -
英语写作质量评估GPT生成文本数据集EnglishWritingQualityAssessmentGPTGeneratedTextDataset-jay12332
英语写作质量评估GPT生成文本数据集EnglishWritingQualityAssessmentGPTGeneratedTextDataset-jay12332 数据来源:互联网公开数据 标签: 英语写作, 文本生成, 语言模型, 文本评估, 写作质量, GPT, 教育, 机器学习 数据概述:... -
印地语语音转录数据集HindiSpeechTranscriptionDataset-manan27jn
印地语语音转录数据集HindiSpeechTranscriptionDataset-manan27jn 数据来源:互联网公开数据 标签:语音识别, 自然语言处理, 文本转录, 印地语, 语音数据, 语言模型, 数据集构建, 声学模型 数据概述: 该数据集包含来自公开渠道的印地语语音转录数据,旨在用于语音识别和自然语言处理任务。主要特征如下:... -
自然语言处理停用词与词汇列表数据集NaturalLanguageProcessingStopwordsandWordlists-nathanh4903
自然语言处理停用词与词汇列表数据集NaturalLanguageProcessingStopwordsandWordlists-nathanh4903 数据来源:互联网公开数据 标签:停用词, 词汇列表, 自然语言处理, 文本分析, 语料库, 文本预处理, 词汇统计, 语言模型 数据概述:... -
偏见生成文本分析数据集Bias-GeneratedTextAnalysis-adityayayaya
偏见生成文本分析数据集Bias-GeneratedTextAnalysis-adityayayaya 数据来源:互联网公开数据 标签:文本生成, 偏见分析, 语言模型, 负面情绪, 文本分类, 机器学习, 伦理研究, 语料库 数据概述: 该数据集包含来自GPT-Neo语言模型生成的文本,记录了模型在不同偏见提示下的输出结果。主要特征如下:... -
波斯语命名实体识别数据集PersianNamedEntityRecognitionDataset-yaserfathihour
波斯语命名实体识别数据集PersianNamedEntityRecognitionDataset-yaserfathihour 数据来源:互联网公开数据 标签:命名实体识别, 自然语言处理, 波斯语, 文本标注, 机器学习, 语料库, 语言模型, 文本分析 数据概述:... -
对话问答数据集ConversationQuestion-AnswerDataset-houzeker
对话问答数据集ConversationQuestion-AnswerDataset-houzeker 数据来源:互联网公开数据 标签:对话, 问答, 文本数据, 自然语言处理, 语义理解, 语言模型, 数据标注, 语料库 数据概述: 该数据集包含来自互联网的对话问答数据,记录了对话的提问与回答内容,适用于训练和评估对话系统、问答系统等。主要特征如下:... -
教育领域在线学习文本数据集EducationOnlineLearningTextDataset-dhrubajyotiguha15
教育领域在线学习文本数据集EducationOnlineLearningTextDataset-dhrubajyotiguha15 数据来源:互联网公开数据 标签:在线学习, 教育, 文本分析, 写作评估, 语言模型, 文本生成, 写作质量, 数据集 数据概述: 该数据集包含来自教育领域的文本数据,记录了学生关于在线学习主题的写作内容。主要特征如下:... -
俄英双语翻译句子对数据集Russian-EnglishSentencePairs-ligtfeather
俄英双语翻译句子对数据集Russian-EnglishSentencePairs-ligtfeather 数据来源:互联网公开数据 标签:机器翻译, 俄语, 英语, 文本对齐, 自然语言处理, 语言模型, 双语语料库, 语料库构建 数据概述: 该数据集包含俄语和英语的句子对,旨在用于机器翻译模型的训练和评估。主要特征如下:... -
文本摘要与风格分析数据集TextSummarizationandStyleAnalysisDataset-daominhkhanh
文本摘要与风格分析数据集TextSummarizationandStyleAnalysisDataset-daominhkhanh 数据来源:互联网公开数据 标签:文本摘要, 风格分析, 文本处理, 自然语言处理, 语言模型, 机器翻译, 文本分类, 数据集 数据概述:... -
日语分词器词汇表数据集JapaneseTokenizerVocabulary-watarukitagawa
日语分词器词汇表数据集JapaneseTokenizerVocabulary-watarukitagawa 数据来源:互联网公开数据 标签:日语分词, 词汇表, 文本处理, 自然语言处理, 词汇分析, 语言模型, 数据集, 词语ID 数据概述: 该数据集包含用于日语文本分词的词汇表数据,记录了日语单词及其对应的Token-ID。主要特征如下:... -
英语词汇频率统计分析数据集EnglishWordFrequencyStatisticsAnalysis-dabber1337
英语词汇频率统计分析数据集EnglishWordFrequencyStatisticsAnalysis-dabber1337 数据来源:互联网公开数据 标签:词频统计, 语言学, 语料库, 自然语言处理, 词汇分析, 文本数据, 语言模型, 英语 数据概述:... -
越南语命名实体识别数据集VietnameseNamedEntityRecognitionDataset-antrngphannh
越南语命名实体识别数据集VietnameseNamedEntityRecognitionDataset-antrngphannh 数据来源:互联网公开数据 标签:命名实体识别, 自然语言处理, 越南语, 文本标注, 语言模型, 文本分析, 数据集, 机器学习 数据概述:... -
诗歌文本改写与生成数据集PoetryTextRewritingandGenerationDataset-pratapsurwase
诗歌文本改写与生成数据集PoetryTextRewritingandGenerationDataset-pratapsurwase 数据来源:互联网公开数据 标签:诗歌, 文本生成, 文本改写, 自然语言处理, 创意写作, 诗歌分析, 语言模型, 数据集 数据概述: 该数据集包含来自pratapsurwase-gemma-... -
文本生成任务指令数据集TextGenerationTaskInstructionDataset-dhrubajyotiguha15
文本生成任务指令数据集TextGenerationTaskInstructionDataset-dhrubajyotiguha15 数据来源:互联网公开数据 标签:文本生成, 指令数据集, 自然语言处理, 文本指令, 深度学习, 数据集构建, 语言模型, 语料库 数据概述:... -
阿拉伯语问答对数据集ArabicQuestionPairsDataset-yanistouatiop
阿拉伯语问答对数据集ArabicQuestionPairsDataset-yanistouatiop 数据来源:互联网公开数据 标签:问答对, 阿拉伯语, 自然语言处理, 文本相似度, 机器翻译, 语义分析, 文本匹配, 语言模型 数据概述:... -
尼日利亚皮钦语文本数据集NigerianPidginTextDataset-harbidel
尼日利亚皮钦语文本数据集NigerianPidginTextDataset-harbidel 数据来源:互联网公开数据 标签:皮钦语, 文本语料库, 语言学, 自然语言处理, 文本分析, 语言模型, 情感分析, 文本挖掘 数据概述: 该数据集包含来自不同来源的尼日利亚皮钦语文本,记录了各种日常交流和新闻报道的语言实例。主要特征如下:... -
文本语言识别数据集TextLanguageDetectionDataset-tranlamtop
文本语言识别数据集TextLanguageDetectionDataset-tranlamtop 数据来源:互联网公开数据 标签:文本分析, 语言识别, 自然语言处理, 多语言, 文本分类, 机器学习, 语料库, 语言模型 数据概述: 该数据集包含来自不同来源的文本数据,记录了文本内容及其对应的语言标签,用于训练和评估语言识别模型。主要特征如下:... -
开放提示词数据集OpenPromptDataset-patriciaonggg
开放提示词数据集OpenPromptDataset-patriciaonggg 数据来源:互联网公开数据 标签:提示词, 文本生成, 自然语言处理, 机器学习, 文本分析, 创意写作, 语言模型, 数据标注 数据概述: 该数据集包含来自开放提示词项目的数据,记录了用于文本生成的提示词及其相关信息。主要特征如下:... -
语音转录文本测试数据集SpeechTranscriptionTextTestDataset-mohamedmotawie
语音转录文本测试数据集SpeechTranscriptionTextTestDataset-mohamedmotawie 数据来源:互联网公开数据 标签:语音识别, 语音转录, 文本分析, 声学模型, 语言模型, 机器翻译, 数据集, 语音处理 数据概述: 该数据集包含来自公开测试数据的语音转录文本,记录了语音文件与其对应的文本转录内容。主要特征如下:...