数据集 - 海数据

Reddit_Comments_Dataset_文本风格迁移任务评论数据集

2026年1月21日 30 118 59

数据集概述本数据集为文本风格迁移任务准备，包含Reddit评论及其正式语言翻译。数据来自20个Subreddits，通过GPT-2筛选高困惑度评论进行翻译，分为原始评论、带标签翻译及带风格示例的翻译文件，共5个文件，支持风格迁移模型训练与评估。文件详解 reddit_comments.csv 文件格式：CSV...

ZIP

对抗样本与困惑度数据集

2025年6月1日 30 94 59

对抗样本与困惑度数据集数据来源：互联网公开数据标签：对抗样本,困惑度,ResNet20,CIFAR-10,CIFAR-100,GPT-2,WikiCorpus 数据概述：...

ZIP

文本摘要困惑度评估数据集TextSummarizationPerplexityEvaluation-deveshloungani

2025年5月15日 30 57 21

文本摘要困惑度评估数据集TextSummarizationPerplexityEvaluation-deveshloungani 数据来源：互联网公开数据标签：文本摘要, 困惑度, 自然语言处理, 评估, 机器学习, 文本分析, 摘要质量, 语料库数据概述：...

ZIP

机器翻译模型评估数据集MachineTranslationModelEvaluationDataset-annieblare

2025年4月29日 30 144 122

机器翻译模型评估数据集MachineTranslationModelEvaluationDataset-annieblare 数据来源：互联网公开数据标签：机器翻译, 文本分析, 语言模型, 困惑度, ChrF评分, 翻译质量, 跨语言, 文本对齐数据概述：...

ZIP

Mistral-8k困惑度评估数据集-hozaifazaki

2025年4月24日 30 193 171

Mistral-8k困惑度评估数据集-hozaifazaki 数据来源：互联网公开数据标签：自然语言处理，大语言模型，困惑度，评估，数据集，文本分析，机器翻译，生成模型数据概述：该数据集包含用于评估Mistral-8k大语言模型困惑度的文本数据，旨在衡量模型对不同文本序列的理解和预测能力。主要特征如下：时间跨度：数据记录时间范围不限，持续更新。...

ZIP

找到5个数据集

Reddit_Comments_Dataset_文本风格迁移任务评论数据集

对抗样本与困惑度数据集

文本摘要困惑度评估数据集TextSummarizationPerplexityEvaluation-deveshloungani

机器翻译模型评估数据集MachineTranslationModelEvaluationDataset-annieblare

Mistral-8k困惑度评估数据集-hozaifazaki

注册成功！