-
Reddit_Comments_Dataset_文本风格迁移任务评论数据集
2026年1月21日 30 118 59
数据集概述 本数据集为文本风格迁移任务准备,包含Reddit评论及其正式语言翻译。数据来自20个Subreddits,通过GPT-2筛选高困惑度评论进行翻译,分为原始评论、带标签翻译及带风格示例的翻译文件,共5个文件,支持风格迁移模型训练与评估。 文件详解 reddit_comments.csv 文件格式:CSV...
-
对抗样本与困惑度数据集
2025年6月1日 30 94 59
对抗样本与困惑度数据集 数据来源:互联网公开数据 标签:对抗样本,困惑度,ResNet20,CIFAR-10,CIFAR-100,GPT-2,WikiCorpus 数据概述:...
-
文本摘要困惑度评估数据集TextSummarizationPerplexityEvaluation-deveshloungani
2025年5月15日 30 57 21
文本摘要困惑度评估数据集TextSummarizationPerplexityEvaluation-deveshloungani 数据来源:互联网公开数据 标签:文本摘要, 困惑度, 自然语言处理, 评估, 机器学习, 文本分析, 摘要质量, 语料库 数据概述:...
-
机器翻译模型评估数据集MachineTranslationModelEvaluationDataset-annieblare
2025年4月29日 30 144 122
机器翻译模型评估数据集MachineTranslationModelEvaluationDataset-annieblare 数据来源:互联网公开数据 标签:机器翻译, 文本分析, 语言模型, 困惑度, ChrF评分, 翻译质量, 跨语言, 文本对齐 数据概述:...
-
Mistral-8k困惑度评估数据集-hozaifazaki
2025年4月24日 30 193 171
Mistral-8k困惑度评估数据集-hozaifazaki 数据来源:互联网公开数据 标签:自然语言处理,大语言模型,困惑度,评估,数据集,文本分析,机器翻译,生成模型 数据概述:该数据集包含用于评估Mistral-8k大语言模型困惑度的文本数据,旨在衡量模型对不同文本序列的理解和预测能力。主要特征如下: 时间跨度:数据记录时间范围不限,持续更新。...



