-
巴黎与耶路撒冷地图文本数据集
数据集概述 本数据集包含八十二份来自巴黎与耶路撒冷历史城市地图的标注样本,以JSON和PKL格式存储地图文本的多边形坐标、转录内容及质量标签(如是否截断、难以辨认),适用于地图文本检测、识别与序列分析任务。 文件详解 核心标注文件:...
-
印度议会颁布的中央法案标注数据集
数据集概述 该数据集包含1838年至2020年印度议会颁布的858部中央法案的结构化标注数据,通过PDF文本提取与正则处理生成JSON格式文件,涵盖法案标题、ID、颁布日期等元信息及章节、条款等结构化内容。 文件详解 文件名称: annotatedCentralActs.zip 文件格式: ZIP压缩包 包含内容:...
-
年龄平衡且受试者多样的毫米波雷达生命体征参考记录数据集
数据集概述 本数据集为毫米波雷达生命体征参考记录数据集,覆盖一百一十名受试者,包含四种测试场景下的雷达数据、参考心电与加速度数据,以及部分实验的非呼吸时段时间戳,按受试者-测试场景结构存储,支持生命体征相关研究。 文件详解 核心数据压缩包: db_records.zip: ZIP格式压缩包,包含各受试者-测试场景的子文件夹,内部文件包括:...
-
TrackMate_ExTrack模块模拟轨迹数据集
数据集概述 该数据集包含用于TrackMate-ExTrack模块教程的模拟轨迹数据,TrackMate-ExTrack是ExTrack软件的Java移植版本。数据以XML、JSON和PNG格式存储,为相关软件教程提供基础模拟数据支持。 文件详解 该数据集包含四个文件,具体说明如下: - XML文件(共两个): - simulated-tracks-...
-
ERR15104896_欧洲核苷酸档案提交关联元数据
数据集概述 本数据集为欧洲核苷酸档案(ENA)提交ERR15104896的关联元数据,包含Genome in a Bottle项目RNA002样本的测序实验相关数据文件,涉及测序仪器、孔道扫描、吞吐量等多维度信息,支持实验数据的溯源与解析。 文件详解 文档类文件...
-
含官能团基准分子数据库
数据集概述 该数据集包含156个分子的计算数据,每个分子对应约800个构象。数据以支持CRUD操作的数据库形式存储,每个分子和构象均有唯一标识符,分子关联对应的官能团信息,同时提供官能团说明的PDF文档,便于分子数据的管理与检索。 文件详解 文件名称:...
-
IPCC第六次评估周期报告参考文献开放数据集_1
数据集概述 该数据集为IPCC第六次评估周期报告的参考文献开放数据集第一版,包含从三份特别报告及第一份评估报告参考文献部分提取的文献列表,提供文本文件与结构化JSON格式数据,记录文献标识、章节信息及数字对象标识符(DOI)。 文件详解...
-
德国一平方公里六边形地理网格数据集
数据集概述 该数据集为德国设计的地理六边形网格,单元格面积为一平方公里。通过统一大小的参考单元,简化了基于行政边界(如大小不一的县市)的统计分析与比较,为空间分析提供了更均匀的单元分布和更优的邻域分析基础。 文件详解 元数据文档: Hexagon_grid_README_METADATA.pdf:...
-
摩泽尔葡萄酒标签出口数据集2024
数据集概述 该数据集为摩泽尔葡萄酒标签出口相关的多格式文件集合,包含JSON、RDF、HTML等类型文件,覆盖数据、代码、文档等类别,涉及数据模型、查询示例、历史记录等内容,为相关研究提供基础数据支持。 文件详解 数据文件: mosel-json-brief_2024-11-27.json:JSON格式,可能为简洁版葡萄酒标签数据 mosel-...
-
重构演化波动性研究完整结果代码与数据集
数据集概述 该数据集是《重构演化波动性研究》论文的可复现资源,包含48个项目的重构数据集、研究问题(RQ1-RQ5)的结果文件、Python脚本及预测代码。数据格式多样,支持实验复现与后续研究扩展,为重构演化波动性领域的学术研究提供基础数据与工具支持。 文件详解 Refactoring...
-
小型永久性淡水湖泊生态系统功能组F2_2指示性分布图
数据集概述 本数据集包含IUCN全球生态系统分类(v2.0)中三级生态系统功能组F2.2(小型永久性淡水湖泊)的指示性分布图及描述性档案,涵盖全球分布模式、关键生态特征与过程,地图标注主要(红色)和次要(黄色)分布区域,供区域尺度查询使用。 文件详解 文件名称: README:无文件格式,包含数据集概述、地图说明及IUCN分类系统引用信息。 文件名称:...
-
家庭食谱分析训练数据集2025
数据集概述 本数据集为虚构的12份家庭食谱语料库,是MiniData Project 2025的一部分,用于研究数据管理与开放科学培训。包含结构化食谱数据、分析脚本、可视化图表、食谱扫描件及配套文档,展示开放科学最佳实践。 文件详解 结构化数据文件: family_recipes.csv:CSV格式,包含食谱ID、名称、食材、食材数量等字段...
-
INR18650_LG_3500_MJ1阳极GITT开路电压数据集
数据集概述 本数据集包含从LG CHEM的INR18650-LG-3500-MJ1圆柱形电池阳极GITT测量中提取的开路电压(OCV)数据,阳极活性材料为石墨/氧化硅复合材料,通过三电极扣式电池测试获取,用于支持电池建模所需的参数化OCV曲线生成。 文件详解 数据文件 18650-LG-3500-MJ1-Anode GITT_dch ohne...
-
土佐日记现代日语及英语翻译数据集
数据集概述 本数据集是《土佐日记》的现代日语及英语翻译文本集合,包含原文及对应翻译内容,以JSON格式存储,涵盖标题、作者、段落文本、假名注音、直译与意译等多维度信息,为古典文学翻译与研究提供结构化资源。 文件详解 该数据集包含一个压缩文件,具体说明如下: - 文件名称: yamagen/tosa-translation-v1.0.0.zip -...
-
冠状病毒开放引文数据集2020_05_16
数据集概述 该数据集由OpenCitations整理,截至2020年5月16日包含约189,697条引文信息及49,719篇相关文献。提供完整数据与用于可视化的部分数据(存储于"_partial.json"文件),支持冠状病毒相关研究的引文网络分析。 文件详解 该数据集以ZIP压缩包形式存储,包含以下文件: - 引文数据文件(JSON格式): -...
-
维基数量与维基测量数据集
数据集概述 该数据集包含Wiki-Quantities和Wiki-Measurements两个子数据集,分别用于支持数量识别与测量上下文提取任务。数据从维基百科文章和维基数据事实启发式生成,部分样本添加S2ORC数据集引用以增强模型鲁棒性,为测量提取系统的开发与评估提供支持。 文件详解 核心压缩文件: Wiki-Quantities.zip:...
-
沙漠风筝及相关建筑数据集
数据集概述 本数据集包含所有已识别的沙漠风筝的位置信息,以及约百分之十样本的详细形态数据,同时涵盖同一地理区域内其他狩猎相关结构的数据。 文件详解 文档文件: Data description.pdf:PDF格式,解释每个要素类的内容。 数据文件(JSON格式,共6个):...
-
iSamples测试用例导出数据集2024
数据集概述 该数据集为iSamples平台导出的标本元数据记录测试用例,包含三个不同格式的文件,用于测试验证场景,覆盖JSON、Parquet和HTML类型,无目录层级结构,文件类型分布均衡。 文件详解 文件名称: stac.json 文件格式: JSON (.json) 字段映射:...
-
阿拉伯_安达卢西亚音乐歌词数据集
数据集概述 该数据集包含CompMusic项目中阿拉伯-安达卢西亚音乐曲库的歌词,涵盖"Isbahan"、"Maya"等九种 nawbas 类型。歌词以原始阿拉伯文和ALA-LC标准转写的罗马化版本呈现,存储为TSV、JSON格式文件,并关联音频文件及元数据。 文件详解 压缩文件: Sanas_v2.zip: ZIP格式压缩包,包含数据集所有内容...
-
生态系统功能群F1_2永久性低地河流指示分布图
数据集概述 该数据集包含IUCN全球生态系统分类(v2.0)中三级生态系统功能群F1.2永久性低地河流的指示分布图与描述性资料,涵盖生态特征概要、全球分布模式地图及方法说明,地图标注主要(红色)和次要(黄色)分布区域,适用于区域尺度查询,非精细点位分析。 文件详解 README:无格式文件,说明数据集背景、地图使用规则及IUCN全球生态系统分类参考链接...



