-
文学创作文本生成数据集LiteratureCreationTextGeneration-nashaatrjouda
文学创作文本生成数据集LiteratureCreationTextGeneration-nashaatrjouda 数据来源:互联网公开数据 标签:文本生成, 语言模型, 创作, 故事生成, 自然语言处理, 语料库, 文本分析, 叙事结构 数据概述: 该数据集包含用于文本生成任务的语料,记录了文学作品中的叙事文本片段。主要特征如下:... -
越南语文本数据分析数据集VietnameseTextDataAnalysis-nguynththanhho
越南语文本数据分析数据集VietnameseTextDataAnalysis-nguynththanhho 数据来源:互联网公开数据 标签:越南语, 文本数据, 自然语言处理, 语料库, 文本分析, 数据清洗, 语言模型, 机器学习 数据概述:... -
阿拉伯语文本相似度评估训练数据集ArabicTextSimilarityEvaluationTrainingDataset-rookiejing
阿拉伯语文本相似度评估训练数据集ArabicTextSimilarityEvaluationTrainingDataset-rookiejing 数据来源:互联网公开数据 标签:文本相似度, 阿拉伯语, 情感分析, 自然语言处理, 机器学习, 文本匹配, 语料库, 语言模型 数据概述:... -
英语作文评分预测数据集EnglishEssayScorePrediction-grushali
英语作文评分预测数据集EnglishEssayScorePrediction-grushali 数据来源:互联网公开数据 标签:作文评分, 文本分析, 机器学习, 自然语言处理, 写作评估, 语言模型, 情感分析, 预测模型 数据概述: 该数据集包含英语作文及其对应的评分数据,用于训练和评估英语作文自动评分模型。主要特征如下:... -
自然语言理解COLA数据集训练与测试NaturalLanguageUnderstandingCOLADatasetTrainandTest-aryansakhala
自然语言理解COLA数据集训练与测试NaturalLanguageUnderstandingCOLADatasetTrainandTest-aryansakhala 数据来源:互联网公开数据 标签:自然语言处理, 文本分类, 句法分析, 语言模型, 文本理解, 机器翻译, 语义分析, 训练集 数据概述:... -
文本生成内容分类数据集TextGenerationContentClassification-sunderekkiz
文本生成内容分类数据集TextGenerationContentClassification-sunderekkiz 数据来源:互联网公开数据 标签:文本分类, 语言模型, 内容生成, 深度学习, 写作风格, 数据标注, 文本分析, 机器学习 数据概述:... -
尼泊尔语拼写纠错数据集NepaliSpellingCorrectionDataset-amardura
尼泊尔语拼写纠错数据集NepaliSpellingCorrectionDataset-amardura 数据来源:互联网公开数据 标签:拼写纠错, 尼泊尔语, 自然语言处理, 文本校对, 语言模型, 错误检测, 数据清洗, 机器翻译 数据概述: 该数据集包含尼泊尔语文本,记录了正确的文本及其对应的错误拼写形式,用于尼泊尔语拼写纠错任务。主要特征如下:... -
文本生成评估训练数据集TextGenerationEvaluationTrainingDataset-marangoz
文本生成评估训练数据集TextGenerationEvaluationTrainingDataset-marangoz 数据来源:互联网公开数据 标签:文本生成, 写作质量, 语言模型, 文本分析, 情感分析, 训练数据, 机器写作, 语料库 数据概述:... -
教育观点评估英语写作数据集EducationOpinionEvaluationEnglishWritingDataset-chiennguyendev
教育观点评估英语写作数据集EducationOpinionEvaluationEnglishWritingDataset-chiennguyendev 数据来源:互联网公开数据 标签:英语写作, 观点分析, 文本评估, 写作训练, 语言模型, 自动化评分, 文本生成, 教育测评 数据概述: 该数据集包含来自chiennguyendev-... -
英法双语翻译对照数据集English-FrenchTranslationDataset-mansikasahoo2
英法双语翻译对照数据集English-FrenchTranslationDataset-mansikasahoo2 数据来源:互联网公开数据 标签:机器翻译, 语言学习, 双语对照, 文本数据, 自然语言处理, 语料库, 语言模型, 文本翻译 数据概述: 该数据集包含英法双语对照的翻译文本,记录了英语句子及其对应的法语翻译。主要特征如下:... -
孟加拉语翻译数据集BanglaTranslationDataset-emammame
孟加拉语翻译数据集BanglaTranslationDataset-emammame 数据来源:互联网公开数据 标签:机器翻译, 孟加拉语, 文本翻译, 自然语言处理, 语言模型, 文本数据, 语料库, 翻译 数据概述: 该数据集包含英语到孟加拉语的翻译文本对,用于机器翻译模型的训练和评估。主要特征如下:... -
文本校对与错误纠正数据集TextProofreadingandErrorCorrectionDataset-austuvarki
文本校对与错误纠正数据集TextProofreadingandErrorCorrectionDataset-austuvarki 数据来源:互联网公开数据 标签:文本校对, 错误纠正, 语言模型, 自然语言处理, 文本编辑, 语法纠错, 句子对齐, 机器翻译 数据概述:... -
泰卢固语词汇分割与分类训练数据集TeluguWordSegmentationandClassificationTrainingDataset-sriram...
泰卢固语词汇分割与分类训练数据集TeluguWordSegmentationandClassificationTrainingDataset-sriramgugulothu 数据来源:互联网公开数据 标签:泰卢固语, 文本分析, 词汇分割, 语言模型, 自然语言处理, 机器翻译, 文本分类, 数据集 数据概述:... -
文本相似度训练数据集TextSimilarityTrainingDataset-krilin
文本相似度训练数据集TextSimilarityTrainingDataset-krilin 数据来源:互联网公开数据 标签:文本相似度, 机器翻译, 文本匹配, 自然语言处理, 语料库, 文本分析, 语言模型, 相似度评估 数据概述: 该数据集包含来自互联网的文本数据,记录了用于训练文本相似度模型的语料。主要特征如下:... -
英语语法纠错数据集EnglishGrammarCorrectionDataset-austuvarki
英语语法纠错数据集EnglishGrammarCorrectionDataset-austuvarki 数据来源:互联网公开数据 标签:语法纠错, 文本校对, 自然语言处理, 语言模型, 机器翻译, 文本生成, 英语学习, 数据增强 数据概述: 该数据集包含来自公开渠道的英语文本数据,记录了原始英文句子及其对应的语法纠正后的版本。主要特征如下:... -
WebNLG2022训练数据文本生成数据集WebNLG2022TrainingDataTextGeneration-thedatadynamo
WebNLG2022训练数据文本生成数据集WebNLG2022TrainingDataTextGeneration-thedatadynamo 数据来源:互联网公开数据 标签:文本生成, 自然语言处理, 数据集, 知识图谱, 语义解析, 机器翻译, 语言模型, 数据增强 数据概述: 该数据集包含来自WebNLG 2022... -
文本语义匹配数据集TextSemanticMatchingDataset-khuongtran1209
文本语义匹配数据集TextSemanticMatchingDataset-khuongtran1209 数据来源:互联网公开数据 标签:语义匹配, 文本相似度, 自然语言处理, 文本理解, 对比分析, 数据集, 机器学习, 语言模型 数据概述: 该数据集包含来自不同来源的文本对,记录了句子对之间的语义关系。主要特征如下:... -
西班牙语问答语料库SpanishQuestionAnsweringCorpus-rhythmnarula
西班牙语问答语料库SpanishQuestionAnsweringCorpus-rhythmnarula 数据来源:互联网公开数据 标签:问答系统, 自然语言处理, 西班牙语, 文本理解, 语料库, 机器阅读, 语言模型, 数据集 数据概述: 该数据集包含来自公开资料的西班牙语问答对,记录了以西班牙语呈现的上下文信息和对应的提问。主要特征如下:... -
韩语论证文本转述数据集KoreanArgumentationTextParaphrasing-iamyourenergy
韩语论证文本转述数据集KoreanArgumentationTextParaphrasing-iamyourenergy 数据来源:互联网公开数据 标签:文本转述, 自然语言处理, 韩语, 语料库, 文本生成, 深度学习, 数据增强, 语言模型 数据概述: 该数据集包含从韩语论证文本中提取的转述文本对,旨在用于训练和评估文本转述模型。主要特征如下:... -
商品店铺俄语翻译数据集ProductShopRussianTranslationDataset-rickykonwar
商品店铺俄语翻译数据集ProductShopRussianTranslationDataset-rickykonwar 数据来源:互联网公开数据 标签:俄语翻译, 商品店铺, 文本翻译, 语言模型, 机器翻译, 零售业, 数据清洗, 自然语言处理 数据概述: 该数据集包含来自俄罗斯零售店铺的商品店铺名称的俄语原文及其对应的英文翻译。主要特征如下:...