-
Bangla_Based_孟加拉语信息检索测试集数据
2026年1月31日 30 107 19
数据集概述 本数据集为孟加拉语信息检索测试集,包含1182份文档(182份泰戈尔的短篇故事、小说、散文,1000份2013年《普罗托姆·阿洛》报纸文章)、94条不同复杂度的查询及查询-文档相关性判断,填补了孟加拉语信息检索标准数据集的空白。 文件详解 文件名称:README.txt 文件格式:TXT...
-
Shared_Research_Repository_BL报纸样本纯文本数据集
2026年1月19日 30 151 118
数据集概述 本数据集包含Shared Research Repository发布的报纸文章纯文本数据,以压缩包形式提供,可用于自然语言处理相关的文本分析任务,总计包含一个文件。 文件详解 压缩文件 文件名称:newspaper_text.zip 文件格式:ZIP...
-
Cheltenham_Town_Newspaper_1933_1934赛季足球新闻档案数据
2026年1月13日 30 139 121
数据集概述 本数据集收录1933年6月1日至1934年5月31日期间报道Cheltenham Town足球俱乐部1933-1934赛季的报纸文章,包含原始文章扫描件(JPEG/PNG格式)、HTML文件、RIS引用文件及XML文本文件,所有内容因超过70年已进入公有领域,共3个文件。 文件详解 s19331934.ris 文件格式:RIS...
-
美国鱼类及野生动物管理局文档_报纸文章
2025年12月23日 30 160 131
数据集概述 本数据集为美国鱼类及野生动物管理局(FWS)Servcat系统中的文档档案,内容涉及美国鱼类和野生动物资源管理相关的报告、备忘录等材料,按主题分类存储于压缩文件中。 文件详解 文件名称: Newspaper_Article.zip 文件格式: ZIP(.zip) 内容说明: 包含来自FWS...
-
Objaverse_Y2K_Newspaper_Based_Y2K报纸文章多格式资料完整数据集
2025年12月16日 30 64 24
数据集概述 该数据集围绕“Y2K报纸文章”主题构建,包含六份文件,主要为图片文件和一个GLB格式文件,整体结构扁平,无分层目录,未划分训练/测试集或数据/标签集,为Y2K相关报纸文章的数字化资料提供基础数据支持。 文件详解 图片文件(.jpeg格式,共5个):...
-
野生稻历史档案
2025年12月7日 30 69 24
数据集概述 该数据集是野生稻历史相关的档案集合,含从明尼苏达州历史学会、在线报纸数据库及私人收藏中搜索到的照片等资料,包含TROPY数据库文件,原始照片标题未改动,便于TROPY程序识别及数据库文件使用。 文件详解 图片文件(.jpg格式,236个):如MNHS docs and photos Aug 16 2018 - 18.jpg、Wild...



