-
英语写作质量评估文本数据集EnglishWritingQualityAssessmentTextDataset-vlomme
英语写作质量评估文本数据集EnglishWritingQualityAssessmentTextDataset-vlomme 数据来源:互联网公开数据 标签:文本质量评估, 英语写作, 语言模型, 文本分析, 自然语言处理, 写作评分, 机器学习, 数据标注 数据概述:... -
语音识别错误校正数据集SpeechRecognitionErrorCorrectionDataset-tuhuutuong
语音识别错误校正数据集SpeechRecognitionErrorCorrectionDataset-tuhuutuong 数据来源:互联网公开数据 标签:语音识别, 语音校正, 文本校正, 声学模型, 语言模型, 深度学习, 数据增强, 自然语言处理 数据概述:... -
文本处理语料库数据集ProcessedCorpusDataset-colinsmyth001
文本处理语料库数据集ProcessedCorpusDataset-colinsmyth001 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,机器学习,文本分类,语言模型,数据挖掘,信息检索 数据概述: 该数据集包含经过预处理的文本语料库,记录了多种来源的文本数据,经过清洗和标准化处理。主要特征如下:... -
文本生成模型评估数据集TextGenerationModelEvaluationDataset-dhruvdarda
文本生成模型评估数据集TextGenerationModelEvaluationDataset-dhruvdarda 数据来源:互联网公开数据 标签:文本生成, 模型评估, 语言模型, 文本质量, 自然语言处理, 语料分析, 机器学习, 生成文本 数据概述: 该数据集包含用于评估文本生成模型性能的数据,记录了生成的文本及其相关质量指标。主要特征如下:... -
CNN和每日邮报新闻摘要增强数据集CNN-DailyMailNewsSummaryAugmentedDataset-lachonman2
CNN和每日邮报新闻摘要增强数据集CNN-DailyMailNewsSummaryAugmentedDataset-lachonman2 数据来源:互联网公开数据 标签:新闻摘要,文本摘要,自然语言处理,深度学习,数据集,文本分析,机器翻译,语言模型 数据概述: 该数据集源自CNN和每日邮报(Daily... -
阿拉伯语文本校对数据集ArabicTextProofreadingDataset-muheshaam
阿拉伯语文本校对数据集ArabicTextProofreadingDataset-muheshaam 数据来源:互联网公开数据 标签:文本校对, 阿拉伯语, 文本纠错, 自然语言处理, 语言模型, 文本相似度, 机器学习, 语料库 数据概述:... -
孟加拉语文本规范化数据集NormalizedPre-BengaliAIDataset-vaibhavsharma3012
孟加拉语文本规范化数据集NormalizedPre-BengaliAIDataset-vaibhavsharma3012 数据来源:互联网公开数据 标签:自然语言处理,孟加拉语,文本规范化,数据集,语言模型,文本预处理,机器学习,人工智能 数据概述: 该数据集包含经过规范化处理的孟加拉语文本数据,旨在用于孟加拉语自然语言处理任务。主要特征如下:... -
人工智能生成文本评估论文数据集ArtificialIntelligenceGeneratedTextEvaluationEssays-dhrubajyotiguha15
人工智能生成文本评估论文数据集ArtificialIntelligenceGeneratedTextEvaluationEssays-dhrubajyotiguha15 数据来源:互联网公开数据 标签:人工智能, 文本生成, 论文写作, 语言模型, 文本评估, 机器学习, 自然语言处理, PaLM 数据概述:... -
印地语-英语平行语料库数据集Hindi-EnglishParallelCorpus-saumyamishra536
印地语-英语平行语料库数据集Hindi-EnglishParallelCorpus-saumyamishra536 数据来源:互联网公开数据 标签:机器翻译, 文本对齐, 语言模型, 印度语言, 语料库, 自然语言处理, 双语数据, 英语 数据概述: 该数据集包含来自互联网的印地语-... -
BERT预训练模型训练数据集BERTPre-trainedModelTrainingDataset-hiromoon166
BERT预训练模型训练数据集BERTPre-trainedModelTrainingDataset-hiromoon166 数据来源:互联网公开数据 标签:自然语言处理,机器学习,数据集,文本分类,深度学习,语言模型,人工智能,计算机科学 数据概述:... -
下一自然段文本生成数据集NextParagraphParaphraseDataset-terrychanorg
下一自然段文本生成数据集NextParagraphParaphraseDataset-terrychanorg 数据来源:互联网公开数据 标签:文本生成,自然语言处理,数据集,机器学习,深度学习,语言模型,文本分析,数据科学 数据概述:该数据集包含来自多个开源文本库的文本数据,用于训练和评估下一自然段生成的文本模型。主要特征如下:... -
文本写作质量评估数据集TextWritingQualityAssessment-rohitsingh9990
文本写作质量评估数据集TextWritingQualityAssessment-rohitsingh9990 数据来源:互联网公开数据 标签:文本质量, 写作评估, 自然语言处理, 语言模型, 文本分析, 机器学习, 文本生成, 写作技巧 数据概述:... -
数据480万人类与大型语言模型文本对比数据集480kHumanvsLLMTextDataset-hozaifazaki99
480万人类与大型语言模型文本对比数据集480kHumanvsLLMTextDataset-hozaifazaki99 数据来源:互联网公开数据 标签:自然语言处理,文本分析,机器学习,对比研究,语言模型,人工智能,数据集,文本生成 数据概述: 该数据集包含480万条文本数据,记录了人类与大型语言模型(LLM)生成的文本对比。主要特征如下:... -
孟加拉语文本翻译数据集BengaliTextTranslationDataset-vihaanagrawal
孟加拉语文本翻译数据集BengaliTextTranslationDataset-vihaanagrawal 数据来源:互联网公开数据 标签:机器翻译, 文本分析, 孟加拉语, 语言学, 自然语言处理, 语料库, 文本预处理, 语言模型 数据概述: 该数据集包含来自互联网的孟加拉语文本片段,记录了用于机器翻译训练的孟加拉语文本。主要特征如下:... -
马拉地语新闻摘要与正文数据集MarathiNewsSummaryandText-ketki19
马拉地语新闻摘要与正文数据集MarathiNewsSummaryandText-ketki19 数据来源:互联网公开数据 标签:新闻摘要, 马拉地语, 文本分析, 自然语言处理, 摘要生成, 文本匹配, 语言模型, 印度 数据概述: 该数据集包含来自马拉地语新闻报道的摘要和正文文本。主要特征如下: 时间跨度:数据未标明具体时间,可视为静态文本语料库。... -
越南语文本数据有效性分析数据集VietnameseTextDataValidityAnalysis-nguynththanhho
越南语文本数据有效性分析数据集VietnameseTextDataValidityAnalysis-nguynththanhho 数据来源:互联网公开数据 标签:越南语, 文本分析, 数据清洗, 文本分类, 自然语言处理, 数据质量, 语言模型, 语料库 数据概述: 该数据集包含来自越南语文本的数据,记录了文本的有效性评估结果。主要特征如下:... -
学术写作文本生成评估数据集AcademicWritingTextGenerationEvaluationDataset-honokashinohara
学术写作文本生成评估数据集AcademicWritingTextGenerationEvaluationDataset-honokashinohara 数据来源:互联网公开数据 标签:文本生成, 学术写作, 论文写作, 机器写作, 文本评估, 自然语言处理, 写作质量, 语言模型 数据概述:... -
波斯语语音转录数据集PersianSpeechTranscriptionDataset-melikasaadi
波斯语语音转录数据集PersianSpeechTranscriptionDataset-melikasaadi 数据来源:互联网公开数据 标签:语音识别, 语音转录, 波斯语, 语音信号处理, 深度学习, 自然语言处理, 声学模型, 语言模型 数据概述: 该数据集包含来自公开渠道的波斯语语音数据及其对应的文本转录。主要特征如下:... -
越南语语音识别转录文本纠错数据集VietnameseSpeechRecognitionTranscriptionCorrectionDataset-khanh14ph
越南语语音识别转录文本纠错数据集VietnameseSpeechRecognitionTranscriptionCorrectionDataset-khanh14ph 数据来源:互联网公开数据 标签:语音识别,文本纠错,越南语,声学模型,语言模型,自然语言处理,深度学习,转录文本 数据概述:... -
汽车使用与文本生成关系分析数据集AutomobileUsage-TextGenerationAnalysis-dhrubajyotiguha15
汽车使用与文本生成关系分析数据集AutomobileUsage-TextGenerationAnalysis-dhrubajyotiguha15 数据来源:互联网公开数据 标签:文本生成, 汽车使用, 议论文, 语言模型, 自然语言处理, 数据集, 文本分析, 二元分类 数据概述:...