-
阿拉伯语文本校对数据集ArabicTextProofreadingDataset-muheshaam
阿拉伯语文本校对数据集ArabicTextProofreadingDataset-muheshaam 数据来源:互联网公开数据 标签:文本校对, 阿拉伯语, 文本纠错, 自然语言处理, 语言模型, 文本相似度, 机器学习, 语料库 数据概述:... -
孟加拉语文本规范化数据集NormalizedPre-BengaliAIDataset-vaibhavsharma3012
孟加拉语文本规范化数据集NormalizedPre-BengaliAIDataset-vaibhavsharma3012 数据来源:互联网公开数据 标签:自然语言处理,孟加拉语,文本规范化,数据集,语言模型,文本预处理,机器学习,人工智能 数据概述: 该数据集包含经过规范化处理的孟加拉语文本数据,旨在用于孟加拉语自然语言处理任务。主要特征如下:... -
人工智能生成文本评估论文数据集ArtificialIntelligenceGeneratedTextEvaluationEssays-dhrubajyotiguha15
人工智能生成文本评估论文数据集ArtificialIntelligenceGeneratedTextEvaluationEssays-dhrubajyotiguha15 数据来源:互联网公开数据 标签:人工智能, 文本生成, 论文写作, 语言模型, 文本评估, 机器学习, 自然语言处理, PaLM 数据概述:... -
印地语-英语平行语料库数据集Hindi-EnglishParallelCorpus-saumyamishra536
印地语-英语平行语料库数据集Hindi-EnglishParallelCorpus-saumyamishra536 数据来源:互联网公开数据 标签:机器翻译, 文本对齐, 语言模型, 印度语言, 语料库, 自然语言处理, 双语数据, 英语 数据概述: 该数据集包含来自互联网的印地语-... -
BERT预训练模型训练数据集BERTPre-trainedModelTrainingDataset-hiromoon166
BERT预训练模型训练数据集BERTPre-trainedModelTrainingDataset-hiromoon166 数据来源:互联网公开数据 标签:自然语言处理,机器学习,数据集,文本分类,深度学习,语言模型,人工智能,计算机科学 数据概述:... -
下一自然段文本生成数据集NextParagraphParaphraseDataset-terrychanorg
下一自然段文本生成数据集NextParagraphParaphraseDataset-terrychanorg 数据来源:互联网公开数据 标签:文本生成,自然语言处理,数据集,机器学习,深度学习,语言模型,文本分析,数据科学 数据概述:该数据集包含来自多个开源文本库的文本数据,用于训练和评估下一自然段生成的文本模型。主要特征如下:... -
文本写作质量评估数据集TextWritingQualityAssessment-rohitsingh9990
文本写作质量评估数据集TextWritingQualityAssessment-rohitsingh9990 数据来源:互联网公开数据 标签:文本质量, 写作评估, 自然语言处理, 语言模型, 文本分析, 机器学习, 文本生成, 写作技巧 数据概述:... -
数据480万人类与大型语言模型文本对比数据集480kHumanvsLLMTextDataset-hozaifazaki99
480万人类与大型语言模型文本对比数据集480kHumanvsLLMTextDataset-hozaifazaki99 数据来源:互联网公开数据 标签:自然语言处理,文本分析,机器学习,对比研究,语言模型,人工智能,数据集,文本生成 数据概述: 该数据集包含480万条文本数据,记录了人类与大型语言模型(LLM)生成的文本对比。主要特征如下:... -
孟加拉语文本翻译数据集BengaliTextTranslationDataset-vihaanagrawal
孟加拉语文本翻译数据集BengaliTextTranslationDataset-vihaanagrawal 数据来源:互联网公开数据 标签:机器翻译, 文本分析, 孟加拉语, 语言学, 自然语言处理, 语料库, 文本预处理, 语言模型 数据概述: 该数据集包含来自互联网的孟加拉语文本片段,记录了用于机器翻译训练的孟加拉语文本。主要特征如下:... -
马拉地语新闻摘要与正文数据集MarathiNewsSummaryandText-ketki19
马拉地语新闻摘要与正文数据集MarathiNewsSummaryandText-ketki19 数据来源:互联网公开数据 标签:新闻摘要, 马拉地语, 文本分析, 自然语言处理, 摘要生成, 文本匹配, 语言模型, 印度 数据概述: 该数据集包含来自马拉地语新闻报道的摘要和正文文本。主要特征如下: 时间跨度:数据未标明具体时间,可视为静态文本语料库。... -
越南语文本数据有效性分析数据集VietnameseTextDataValidityAnalysis-nguynththanhho
越南语文本数据有效性分析数据集VietnameseTextDataValidityAnalysis-nguynththanhho 数据来源:互联网公开数据 标签:越南语, 文本分析, 数据清洗, 文本分类, 自然语言处理, 数据质量, 语言模型, 语料库 数据概述: 该数据集包含来自越南语文本的数据,记录了文本的有效性评估结果。主要特征如下:... -
学术写作文本生成评估数据集AcademicWritingTextGenerationEvaluationDataset-honokashinohara
学术写作文本生成评估数据集AcademicWritingTextGenerationEvaluationDataset-honokashinohara 数据来源:互联网公开数据 标签:文本生成, 学术写作, 论文写作, 机器写作, 文本评估, 自然语言处理, 写作质量, 语言模型 数据概述:... -
波斯语语音转录数据集PersianSpeechTranscriptionDataset-melikasaadi
波斯语语音转录数据集PersianSpeechTranscriptionDataset-melikasaadi 数据来源:互联网公开数据 标签:语音识别, 语音转录, 波斯语, 语音信号处理, 深度学习, 自然语言处理, 声学模型, 语言模型 数据概述: 该数据集包含来自公开渠道的波斯语语音数据及其对应的文本转录。主要特征如下:... -
越南语语音识别转录文本纠错数据集VietnameseSpeechRecognitionTranscriptionCorrectionDataset-khanh14ph
越南语语音识别转录文本纠错数据集VietnameseSpeechRecognitionTranscriptionCorrectionDataset-khanh14ph 数据来源:互联网公开数据 标签:语音识别,文本纠错,越南语,声学模型,语言模型,自然语言处理,深度学习,转录文本 数据概述:... -
汽车使用与文本生成关系分析数据集AutomobileUsage-TextGenerationAnalysis-dhrubajyotiguha15
汽车使用与文本生成关系分析数据集AutomobileUsage-TextGenerationAnalysis-dhrubajyotiguha15 数据来源:互联网公开数据 标签:文本生成, 汽车使用, 议论文, 语言模型, 自然语言处理, 数据集, 文本分析, 二元分类 数据概述:... -
孟加拉语数学推理与解题训练数据集-z4hiid
孟加拉语数学推理与解题训练数据集-z4hiid 数据来源:互联网公开数据 标签:孟加拉语,数学,推理,问题解决,链式思维,教育,语言模型,训练数据 数据概述: 本数据集旨在通过语言模型的帮助,使孟加拉语中的数学推理和问题解决任务的训练和评估更加简便和有效。数据集包含各种数学问题的详细解决方案,每个解决方案都采用链式思维(Chain-of-... -
英语写作质量评估数据集EnglishWritingQualityAssessment-harshaas07
英语写作质量评估数据集EnglishWritingQualityAssessment-harshaas07 数据来源:互联网公开数据 标签:英语写作, 文本质量, 语言评估, 自然语言处理, 文本分析, 机器学习, 写作评分, 语言模型 数据概述: 该数据集包含来自公开来源的英语写作文本,记录了不同作者的写作样本及其质量评估结果。主要特征如下:... -
英语完形填空测试题数据集EnglishClozeTestQuestions-noorsaeed
英语完形填空测试题数据集EnglishClozeTestQuestions-noorsaeed 数据来源:互联网公开数据 标签:完形填空, 英语学习, 文本分析, 语言测试, 词汇理解, 阅读理解, 英语考试, 语言模型 数据概述: 该数据集包含英语完形填空测试题目,记录了用于评估英语语言理解能力的结构化文本示例。主要特征如下:... -
英法双语翻译语句数据集English-FrenchBilingualTranslationSentences-alihassanml
英法双语翻译语句数据集English-FrenchBilingualTranslationSentences-alihassanml 数据来源:互联网公开数据 标签:机器翻译, 语言学习, 双语语料库, 文本处理, 自然语言处理, 语料分析, 语言模型, 词汇对应 数据概述:... -
文本嵌入与词向量分析数据集TextEmbeddingandWordVectorAnalysisDataset-hkhnhduy
文本嵌入与词向量分析数据集TextEmbeddingandWordVectorAnalysisDataset-hkhnhduy 数据来源:互联网公开数据 标签:文本分析, 词向量, 嵌入模型, 自然语言处理, 深度学习, 语言模型, 数据可视化, 模型训练 数据概述:...