找到739个数据集

标签: 文本生成

过滤结果
  • 圣诞BMJ标题生成的人工智能观测研究数据集

    2025年12月21日 30 183 102

    数据集概述 本数据集包含用于研究“幽灵在机器中还是打字机前的猴子——使用人工智能生成圣诞BMJ标题”的相关数据与分析脚本,为该观测研究提供完整的数据支撑。 文件详解 文件名称: 3_analysisScript.rmd 文件格式: .rmd 内容说明: R语言Markdown格式的分析脚本,用于处理和分析研究数据 文件名称:...
    packageimg
  • BabelCoder_代理代码翻译与规范对齐数据集

    2025年12月21日 30 101 43

    数据集概述 该数据集围绕“代理代码翻译与规范对齐”主题构建,包含一个压缩文件,可能涉及代码翻译任务中代理机制与规范对齐方法的相关数据,未明确划分训练/测试、数据/标签或原始/处理数据。 文件详解 文件名称: dataset.zip 文件格式: ZIP压缩包(.zip) 内容说明: 压缩包内具体文件结构及内容未提供预览,需解压后查看。 适用场景...
    packageimg
  • AKT_NUTQIDA_AUTENTIK_MATNLAR_YARATISHDA_SOHAGA_BO_LGAN_LEKSIK_BIRLIKLARDAN_FO...

    2025年12月20日 30 41 32

    数据集概述 本数据集围绕在真实文本创作中使用专业领域词汇单元的可能性展开,核心内容为相关研究文档,以PDF格式呈现,为探究领域词汇在文本生成中的应用提供资料支持。 文件详解 文件名称: Ibragimova Muharram.pdf 文件格式: PDF (.pdf) 文件内容:...
    packageimg
  • 可用性相关缺陷的大语言模型数据集

    2025年12月6日 30 164 128

    数据集概述 该数据集围绕大语言模型在可用性相关缺陷中的应用,包含真实数据、提示词、原始数据及可用性修复相关内容,为研究大语言模型处理可用性缺陷的表现提供数据支持。 文件详解 文件名称: Data.zip 文件格式: ZIP压缩包 内容说明: 压缩包内包含四类核心数据:真实数据(Ground-truth...
    packageimg
  • 含参数单比特错误的OPUS_MT与T5模型生成文本数据集

    2025年12月15日 30 83 14

    数据集概述 该数据集包含T5和OPUS-MT两种大语言模型在参数含单比特错误与无错误情况下的生成文本。T5基于CNN Daily Mail数据集完成摘要任务,OPUS-MT基于IWSLT2017数据集完成汉英翻译任务,覆盖FP32和FP16两种量化版本模型的输出对比。 文件详解 该数据集包含四个模型版本目录及对应文件,具体说明如下: - 目录结构: -...
    packageimg
  • Text2KGBench本体驱动文本生成知识图谱基准数据集

    2025年12月13日 30 131 55

    数据集概述 该数据集是用于评估语言模型在本体引导下从文本生成知识图谱能力的基准,包含Wikidata-TekGen(十个本体、一万三千四百七十四句)和DBpedia-WebNLG(十九个本体、四千八百六十句)两个子数据集,遵循本体约束提取文本事实。 文件详解 数据集以压缩包形式提供,内部结构及内容如下: - 压缩包文件:...
    packageimg
  • 提格利尼亚语语言建模数据集TLMD_v1_0_0

    2025年12月13日 30 122 23

    数据集概述 该数据集是为提格利尼亚语语言建模构建的单语种数据集,是同类数据中规模最大的提格利尼亚语数据集。数据经轻量清理,包含训练集(百分之九十八)和验证集(百分之二),支持自然语言处理研究。 文件详解 文件名称: tlmd_v1.0.0.zip 文件格式: ZIP压缩包 数据结构:...
    packageimg
  • 语义相关性句子对数据集2023

    2025年12月9日 30 68 54

    数据集概述 该数据集包含五千五百个英文句子对,每个句子对依据语义相关程度被赋予零到一的评分,零代表最不相关,一代表最相关。数据通过最佳最差标度法(Best-Worst Scaling)收集,旨在支持句子语义相关性、句子表示方法及相关应用的研究。 文件详解 核心数据文件: sem_text_rel_ranked.csv:...
    packageimg
  • 多语言合成出院小结数据集_基于心力衰竭临床病例

    2025年12月6日 30 143 79

    数据集概述 该数据集包含一千份心脏病学临床病例报告及其对应的多语言合成出院小结,覆盖英语、西班牙语和荷兰语三种语言。小结由GPT-4o-mini通过零样本提示生成并翻译,旨在为临床自然语言处理系统提供训练与评估数据支持。 文件详解 根目录文件: MultiSynDS.zip: 压缩文件,包含数据集所有内容 子目录结构:...
    packageimg
  • Graphine_图感知术语定义生成数据集

    2025年12月4日 30 163 96

    数据集概述 该数据集是EMNLP 2021论文的配套数据,用于支持图感知术语定义生成任务的研究。数据集以压缩包形式提供,包含完成相关任务所需的全部数据内容,具体格式需参考压缩包内的说明文档。 文件详解 文件名称: Graphine.zip 文件格式: ZIP压缩包 内容说明:...
    packageimg
  • 法语文本生成与翻译评估数据集

    2025年11月19日 30 177 172

    法语文本生成与翻译评估数据集_French_Text_Generation_and_Translation_Evaluation_Dataset 数据来源:互联网公开数据 标签:文本生成, 机器翻译, 法语, 文本评估, 语言模型, 自然语言处理, 文本比较, 数据集 数据概述:...
    packageimg
  • 图像描述越南语数据集

    2025年11月17日 30 71 69

    图像描述越南语数据集_Image_Description_Vietnamese_Dataset 数据来源:互联网公开数据 标签:图像描述, 计算机视觉, 自然语言处理, 越南语, 图像标注, 文本生成, 多模态学习, 机器翻译 数据概述: 该数据集包含图像文件及其对应的越南语描述,用于图像理解和文本生成任务。主要特征如下:...
    packageimg
  • 加泰罗尼亚语文本词汇预测数据集

    2025年11月12日 30 157 33

    加泰罗尼亚语文本词汇预测数据集_Catalan_Text_Vocabulary_Prediction 数据来源:互联网公开数据 标签:自然语言处理, 文本预测, 语言模型, 加泰罗尼亚语, 词汇分析, 深度学习, 语料库, 文本生成 数据概述:...
    packageimg
  • 文本生成与人工作品对比数据集

    2025年11月10日 30 157 45

    文本生成与人工作品对比数据集_Text_Generation_vs_Human_Written_Content 数据来源:互联网公开数据 标签:文本生成, 自然语言处理, 情感分析, 写作风格, 文本分类, 机器学习, 对比分析, 数据标注 数据概述:...
    packageimg
  • 文本生成模型预测结果提交数据集

    2025年11月8日 30 52 36

    文本生成模型预测结果提交数据集_Text_Generation_Model_Prediction_Submission 数据来源:互联网公开数据 标签:文本生成, 自然语言处理, 模型预测, 机器学习, 结果提交, 数据分析, 竞赛数据, 生成文本 数据概述: 该数据集包含文本生成模型的预测结果,用于评估模型在生成文本方面的表现。主要特征如下:...
    packageimg
  • 儿童英语句子重组训练数据集

    2025年11月7日 30 127 27

    儿童英语句子重组训练数据集_Children_s_English_Sentence_Reconstruction_Training_Dataset 数据来源:互联网公开数据 标签:英语学习, 句子重组, 文本生成, 语言模型, 自然语言处理, 英语教育, 语料库, 数据集 数据概述:...
    packageimg
  • 多领域论文摘要生成数据集

    2025年10月25日 30 28 11

    多领域论文摘要生成数据集_Multi_domain_Paper_Abstract_Generation_Dataset 数据来源:互联网公开数据 标签:文本摘要, 论文摘要, 自然语言处理, 机器翻译, 深度学习, 文本生成, 多领域, 数据集 数据概述: 该数据集包含来自多个领域论文的文本数据,记录了论文的原文文本和对应的摘要。主要特征如下:...
    packageimg
  • 大语言模型微调问答数据集

    2025年10月22日 30 165 102

    大语言模型微调问答数据集_Large_Language_Model_Fine_tuning_Question_Answering_Dataset 数据来源:互联网公开数据 标签:大语言模型, 微调, 问答, 自然语言处理, 文本生成, 模型训练, 迁移学习, 机器学习 数据概述:...
    packageimg
  • 图像描述生成数据集

    2025年8月18日 60 80 21

    图像描述生成数据集_Image_Caption_Generation_Dataset 数据来源:互联网公开数据 标签:图像识别, 图像描述, 计算机视觉, 自然语言处理, 文本生成, 多模态学习, 数据集构建, 图像标注 数据概述: 该数据集包含从公开来源收集的图像及其对应的描述性文本,用于训练和评估图像描述生成模型。主要特征如下:...
    packageimg
  • 国际新闻文本摘要数据集

    2025年10月20日 30 209 65

    国际新闻文本摘要数据集_International_News_Text_Summary_Dataset 数据来源:互联网公开数据 标签:新闻摘要, 文本分析, 自然语言处理, 文本分类, 舆情分析, 机器阅读, 语料库, 文本生成 数据概述:...
    packageimg