-
全球200万SARS_CoV_2基因组数据集_Viridian_Maple0_6_11处理
2025年12月24日 30 11 5
数据集概述 该数据集包含经MAPLE0.6.11处理的全球200万条SARS-CoV-2基因组数据,源自Viridian平台。涵盖基因组比对、变异信息、进化树及元数据等多类型文件,为新冠病毒基因组研究提供基础数据支持。 文件详解 元数据文件:...
-
LLM一致性测试组合测试用例数据集
2025年12月18日 30 197 129
数据集概述 该数据集是用于大语言模型(LLM)一致性测试的组合测试用例集合,包含问题、同义词列表、覆盖数组、测试运行记录、模型输出及性能评估结果,支持分析Starling-LM、Llama系列等6个模型的响应一致性与准确性。 文件详解 核心问题文件:...
-
俄罗斯姓名性别识别数据库
2025年12月14日 30 21 16
数据集概述 该数据集包含俄罗斯联邦范围内的姓名、姓氏及父称信息,用于训练基于全名的性别识别算法。数据以MongoDB数据库格式准备,包含BSON和JSONL格式的压缩文件,为性别识别和全名解析软件提供数据支持。 文件详解 文件名称:russiannames_db_bson.zip 文件格式:ZIP压缩包...
-
基于物联网的活动检测服务生成器原型与评估数据集
2025年12月10日 30 118 17
数据集概述 该数据集是物联网活动检测服务生成器原型的配套数据,包含智能工厂与智慧医疗两个场景的服务生成及评估文件。按功能分为服务生成与应用评估子文件夹,提供生成服务的Python脚本、物联网输入数据、专家标注、评估用物联网日志、真值数据及检测结果等,支持复现论文中的服务生成与评估流程。 文件详解...
-
技术手册问答基准数据集2025_TechManualQA_350
2025年12月8日 30 13 10
数据集概述 该数据集为技术手册问答基准数据集,包含来自10类技术手册的350个验证问答对,覆盖通用事实、流程指导、不可回答三类问题类型,用于评估大语言模型处理技术文档的性能,数据经自动化过滤与人工验证,确保质量可靠。 文件详解 主数据集文件:...



