找到2个数据集

标签: 多模态文本

过滤结果
  • Goodreads_Source_西班牙语儿童及青少年文学评论数据_2020

    2026年1月20日 30 41 23

    数据集概述 本数据集通过分析Goodreads平台2016至2019年间的19本西班牙语儿童及青少年文学书籍、353名用户及588条评论构成的语料库,探究西班牙语儿童及青少年文学的存在情况,旨在证明Goodreads作为社会阅读研究空间的价值,支持相关学术研究与分析。 文件详解 文件名称:Valoraciones_Leyendo_al_lector...
    packageimg
  • Sensorium对话语料库_检索增强生成

    2025年12月21日 30 81 44

    数据集概述 该数据集是为Sensorium ARC项目(海洋数据探索与生态诗意气候传播的交互式AI代理系统)构建的多模态文本语料库,包含生态艺术档案、科学报告、项目框架及诗意对话转录等PDF文档,作为检索增强生成(RAG)的核心数据库。 文件详解 数据集包含一个压缩文件: 文件名称: corpus.zip 文件格式: ZIP压缩包...
    packageimg