-
多语言平行文本互译数据集MultilingualParallelTextTranslationDataset-shubhamkathiriya
多语言平行文本互译数据集MultilingualParallelTextTranslationDataset-shubhamkathiriya 数据来源:互联网公开数据 标签:机器翻译, 文本翻译, 多语言, 语言模型, 文本校对, 西班牙语, 印地语, 英语 数据概述:... -
多语言文本改写与翻译数据集MultilingualTextRewritingandTranslationDataset-yinjiashu
多语言文本改写与翻译数据集MultilingualTextRewritingandTranslationDataset-yinjiashu 数据来源:互联网公开数据 标签:文本改写, 机器翻译, 多语言, 语言模型, 文本生成, 自然语言处理, 文本校对, 语言学习 数据概述:... -
语音转录文本数据集AudioTranscriptionTextDataset-quangphat
语音转录文本数据集AudioTranscriptionTextDataset-quangphat 数据来源:互联网公开数据 标签:语音识别, 语音转录, 文本分析, 越南语, 声学模型, 文本校对, 自然语言处理, 数据集构建 数据概述: 该数据集包含来自公开渠道的越南语语音转录文本数据,旨在用于语音识别与转录任务。主要特征如下:... -
尼泊尔语拼写纠错数据集NepaliSpellingCorrectionDataset-amardura
尼泊尔语拼写纠错数据集NepaliSpellingCorrectionDataset-amardura 数据来源:互联网公开数据 标签:拼写纠错, 尼泊尔语, 自然语言处理, 文本校对, 语言模型, 错误检测, 数据清洗, 机器翻译 数据概述: 该数据集包含尼泊尔语文本,记录了正确的文本及其对应的错误拼写形式,用于尼泊尔语拼写纠错任务。主要特征如下:... -
文本校对与错误纠正数据集TextProofreadingandErrorCorrectionDataset-austuvarki
文本校对与错误纠正数据集TextProofreadingandErrorCorrectionDataset-austuvarki 数据来源:互联网公开数据 标签:文本校对, 错误纠正, 语言模型, 自然语言处理, 文本编辑, 语法纠错, 句子对齐, 机器翻译 数据概述:... -
英语语法纠错数据集EnglishGrammarCorrectionDataset-austuvarki
英语语法纠错数据集EnglishGrammarCorrectionDataset-austuvarki 数据来源:互联网公开数据 标签:语法纠错, 文本校对, 自然语言处理, 语言模型, 机器翻译, 文本生成, 英语学习, 数据增强 数据概述: 该数据集包含来自公开渠道的英语文本数据,记录了原始英文句子及其对应的语法纠正后的版本。主要特征如下:... -
英文拼写纠错数据集EnglishSpellingCorrectionDataset-amalsakkoumi
英文拼写纠错数据集EnglishSpellingCorrectionDataset-amalsakkoumi 数据来源:互联网公开数据 标签:拼写纠错, 自然语言处理, 文本校对, 语言模型, 词汇纠正, 机器学习, 英语学习, 文本数据 数据概述:... -
文本内容变异检测数据集TextContentMutationDetection-devayani14
文本内容变异检测数据集TextContentMutationDetection-devayani14 数据来源:互联网公开数据 标签:文本分析, 数据清洗, 文本变异, 恶意文本, 错误检测, 数据挖掘, 自然语言处理, 文本校对 数据概述: 该数据集包含来自互联网的数据,记录了文本内容及其变异版本,用于检测文本在不同情况下的变化。主要特征如下:... -
多语言机器翻译回译验证集MultilingualMachineTranslationBack-translatedValidationSet-antozaelgamd
多语言机器翻译回译验证集MultilingualMachineTranslationBack-translatedValidationSet-antozaelgamd 数据来源:互联网公开数据 标签:机器翻译, 回译, 文本摘要, 多语言, 文本校对, 语言模型, 数据增强, 验证集 数据概述:... -
语音转录文本数据集SpeechTranscriptionTextDataset-sanjaymalladi29
语音转录文本数据集SpeechTranscriptionTextDataset-sanjaymalladi29 数据来源:互联网公开数据 标签:语音识别, 文本分析, 语音转录, 文本标注, 自然语言处理, 数据挖掘, 语料库, 文本校对 数据概述: 该数据集包含语音转录文本数据,记录了从语音文件中提取的文本内容。主要特征如下:... -
书籍文本错误纠正数据集-shuaibing
书籍文本错误纠正数据集-shuaibing 数据来源:互联网公开数据 标签:文本纠错,自然语言处理,数据集,机器学习,文本校对,语言模型,文本处理,错误检测 数据概述: 该数据集包含书籍文本及其对应的校正后文本,用于训练和评估文本错误纠正模型。主要特征如下: 时间跨度:数据记录的时间跨度涵盖了不同时期出版的书籍。... -
大规模文本生成与校对数据集BYT5-CorrectedDataset-jakir57
大规模文本生成与校对数据集BYT5-CorrectedDataset-jakir57 数据来源:互联网公开数据 标签:自然语言处理,文本生成,文本校对,数据集,机器翻译,语言模型,文本纠错,人工智能 数据概述: 该数据集基于 Google 的大型语言模型 T5,记录了大规模文本生成和校对的数据。主要特征如下:... -
波斯语拼写纠错数据集-FASpell数据集
波斯语拼写纠错数据集-FASpell数据集 数据来源:互联网公开数据 标签:波斯语,Farsi,拼写纠错,自然语言处理,NLP,语言学,文本校对,教育,机器学习 数据概述:...