-
俄语平行语料机器翻译数据集Russian-EnglishParallelCorpusforMachineTranslation-riapush
俄语平行语料机器翻译数据集Russian-EnglishParallelCorpusforMachineTranslation-riapush 数据来源:互联网公开数据 标签:机器翻译, 俄语, 英语, 平行语料, 自然语言处理, 文本对齐, 语言模型, 跨语言 数据概述:... -
乌尔都语新闻摘要数据集UrduNewsSummaryDataset-muhammedjamalmustafa
乌尔都语新闻摘要数据集UrduNewsSummaryDataset-muhammedjamalmustafa 数据来源:互联网公开数据 标签:新闻摘要, 文本摘要, 乌尔都语, 自然语言处理, 文本分析, 语料库, 深度学习, 语言模型 数据概述: 该数据集包含来自互联网的乌尔都语新闻报道摘要。主要特征如下:... -
越南语文本数据增强数据集VietnameseTextDataAugmentation-lvhieu
越南语文本数据增强数据集VietnameseTextDataAugmentation-lvhieu 数据来源:互联网公开数据 标签:文本增强, 越南语, 自然语言处理, 数据集构建, 机器翻译, 语言模型, 数据扩充, 文本生成 数据概述: 该数据集包含用于越南语文本数据增强的语料,记录了越南语文本对及其对应的增强版本。主要特征如下:... -
情景喜剧剧本对话数据集SitcomScriptDialogueDataset-kipabed
情景喜剧剧本对话数据集SitcomScriptDialogueDataset-kipabed 数据来源:互联网公开数据 标签:剧本分析, 对话内容, 自然语言处理, 文本挖掘, 情感分析, 喜剧, 语言模型, 影视剧本 数据概述: 该数据集包含来自情景喜剧剧本的对话文本,记录了剧集中角色间的互动与对白。主要特征如下:... -
新闻语料标题与正文关联分析数据集NewsCorpusTitleandBodyAssociation-abhi0708
新闻语料标题与正文关联分析数据集NewsCorpusTitleandBodyAssociation-abhi0708 数据来源:互联网公开数据 标签:新闻语料, 文本分析, 自然语言处理, 标题生成, 摘要提取, 语言模型, 文本相似度, 数据挖掘 数据概述:... -
孟加拉语文本数据集BengaliTextDataset-nasiatfahim
孟加拉语文本数据集BengaliTextDataset-nasiatfahim 数据来源:互联网公开数据 标签:孟加拉语, 文本数据, 语料库, 自然语言处理, 文本分析, 机器翻译, 情感分析, 语言模型 数据概述: 该数据集包含来自互联网的孟加拉语文本数据,记录了各种主题的孟加拉语文本内容。主要特征如下:... -
自然语言处理词汇表与文本生成数据集NaturalLanguageProcessingVocabularyandTextGenerationDataset-luffyxu
自然语言处理词汇表与文本生成数据集NaturalLanguageProcessingVocabularyandTextGenerationDataset-luffyxu 数据来源:互联网公开数据 标签:自然语言处理, 词汇表, 文本生成, 语言模型, 深度学习, 文本分析, 数据预处理, 词嵌入 数据概述:... -
多语言文本改写与翻译数据集MultilingualTextRewritingandTranslationDataset-yinjiashu
多语言文本改写与翻译数据集MultilingualTextRewritingandTranslationDataset-yinjiashu 数据来源:互联网公开数据 标签:文本改写, 机器翻译, 多语言, 语言模型, 文本生成, 自然语言处理, 文本校对, 语言学习 数据概述:... -
印度地区印地语语音转录测试数据集IndianHindiSpeechTranscriptionTestDataset-theakash04
印度地区印地语语音转录测试数据集IndianHindiSpeechTranscriptionTestDataset-theakash04 数据来源:互联网公开数据 标签:语音识别, 印地语, 语音转录, 声学模型, 语言模型, 语音数据集, 印度, 语音处理 数据概述:... -
孟加拉语神经机器翻译训练数据集BanglaNeuralMachineTranslationTrainingData-rakibullah
孟加拉语神经机器翻译训练数据集BanglaNeuralMachineTranslationTrainingData-rakibullah 数据来源:互联网公开数据 标签:机器翻译, 孟加拉语, 自然语言处理, 文本数据, 训练集, 文本对齐, 神经网络, 语言模型 数据概述:... -
波斯语医学问答数据集PersianMedicalQuestionAnsweringDataset-yeganehmohammadi
波斯语医学问答数据集PersianMedicalQuestionAnsweringDataset-yeganehmohammadi 数据来源:互联网公开数据 标签:医学问答, 波斯语, 自然语言处理, 问答系统, 医疗对话, 文本分析, 数据集, 语言模型 数据概述:... -
人工智能生成文章写作质量评估数据集AI-GeneratedEssayWritingQualityEvaluationDataset-wu468ef
人工智能生成文章写作质量评估数据集AI-GeneratedEssayWritingQualityEvaluationDataset-wu468ef 数据来源:互联网公开数据 标签:人工智能, 文本生成, 写作评估, 语言模型, 文本分析, 机器学习, 语料库, 写作质量 数据概述:... -
英语写作质量评估数据集EnglishWritingQualityEvaluation-williamalabi
英语写作质量评估数据集EnglishWritingQualityEvaluation-williamalabi 数据来源:互联网公开数据 标签:文本分析, 写作评估, 语言模型, 自然语言处理, 语法, 连贯性, 词汇, 风格, 机器学习 数据概述:... -
文本可读性分析数据集TextReadabilityAnalysisDataset-maunish
文本可读性分析数据集TextReadabilityAnalysisDataset-maunish 数据来源:互联网公开数据 标签:文本分析, 可读性, 自然语言处理, 语料库, 文本理解, 语言模型, 教育, 写作 数据概述: 该数据集包含来自互联网的文本数据,记录了文本内容及其可读性评估结果。主要特征如下:... -
泰米尔语文本翻译数据集TamilLanguageTranslationDataset-rnaveenprakash
泰米尔语文本翻译数据集TamilLanguageTranslationDataset-rnaveenprakash 数据来源:互联网公开数据 标签:泰米尔语, 机器翻译, 文本翻译, 语言模型, 自然语言处理, 数据集构建, 语言学, 语料库 数据概述: 该数据集包含泰米尔语文本及其对应的翻译,旨在用于训练和评估机器翻译模型。主要特征如下:... -
土耳其语问答数据集TurkishQuestionAnsweringDataset-mehmetberatersari
土耳其语问答数据集TurkishQuestionAnsweringDataset-mehmetberatersari 数据来源:互联网公开数据 标签:问答系统, 自然语言处理, 文本理解, 土耳其语, 机器阅读, 信息检索, 语言模型, 知识问答 数据概述:... -
英语写作质量评估GPT生成文本数据集EnglishWritingQualityAssessmentGPTGeneratedTextDataset-jay12332
英语写作质量评估GPT生成文本数据集EnglishWritingQualityAssessmentGPTGeneratedTextDataset-jay12332 数据来源:互联网公开数据 标签: 英语写作, 文本生成, 语言模型, 文本评估, 写作质量, GPT, 教育, 机器学习 数据概述:... -
印地语语音转录数据集HindiSpeechTranscriptionDataset-manan27jn
印地语语音转录数据集HindiSpeechTranscriptionDataset-manan27jn 数据来源:互联网公开数据 标签:语音识别, 自然语言处理, 文本转录, 印地语, 语音数据, 语言模型, 数据集构建, 声学模型 数据概述: 该数据集包含来自公开渠道的印地语语音转录数据,旨在用于语音识别和自然语言处理任务。主要特征如下:... -
自然语言处理停用词与词汇列表数据集NaturalLanguageProcessingStopwordsandWordlists-nathanh4903
自然语言处理停用词与词汇列表数据集NaturalLanguageProcessingStopwordsandWordlists-nathanh4903 数据来源:互联网公开数据 标签:停用词, 词汇列表, 自然语言处理, 文本分析, 语料库, 文本预处理, 词汇统计, 语言模型 数据概述:... -
偏见生成文本分析数据集Bias-GeneratedTextAnalysis-adityayayaya
偏见生成文本分析数据集Bias-GeneratedTextAnalysis-adityayayaya 数据来源:互联网公开数据 标签:文本生成, 偏见分析, 语言模型, 负面情绪, 文本分类, 机器学习, 伦理研究, 语料库 数据概述: 该数据集包含来自GPT-Neo语言模型生成的文本,记录了模型在不同偏见提示下的输出结果。主要特征如下:...