找到1个数据集

标签: 分词数量

过滤结果
  • Reddit_Comments_Dataset_文本风格迁移任务评论数据集

    2026年1月21日 30 21 14

    数据集概述 本数据集为文本风格迁移任务准备,包含Reddit评论及其正式语言翻译。数据来自20个Subreddits,通过GPT-2筛选高困惑度评论进行翻译,分为原始评论、带标签翻译及带风格示例的翻译文件,共5个文件,支持风格迁移模型训练与评估。 文件详解 reddit_comments.csv 文件格式:CSV...
    packageimg