-
statisticalLearning_RL_data_数据集
数据集概述 本数据集包含一个压缩文件,与统计学习和强化学习相关。文件总数为1,无目录结构,主要文件格式为ZIP,未检测到文件命名模式,不包含训练/测试、数据/标签或原始/处理数据的划分,也无README或内容预览。 文件详解 文件名称:data.zip 文件格式:ZIP 字段映射介绍:无可用内容预览,无法提供字段映射信息。 适用场景 统计学习研究:...
-
LLM_Based_非结构化数据迁移至关系型数据库测试模型文档
数据集概述 本数据集包含用于测试“利用预训练大语言模型将非结构化数据迁移至关系型数据库”方法的选定模型文档,核心内容围绕数据迁移方法的模型测试展开,共包含一个文档文件。 文件详解 文件名称:Modelos selecionados para testar a abordagem de Migração de Dados Não Estruturados...
-
PAMAP2_Based_物理活动监测预处理数据集v0_1_0
数据集概述 本数据集是基于PAMAP2物理活动监测数据集的预处理版本,通过mcfly仓库代码处理生成,预处理方式参考Reiss和Stricker 2012年论文。提取活动期间512长度窗口数据,仅保留手部、脚踝、胸部16g加速度计变量及所有受试者均参与的活动数据,包含1个压缩文件。 文件详解 文件名称:data.zip 文件格式:ZIP(压缩文件)...
-
PACING_Source_心脏起搏器软件行为模型与测试研究数据
数据集概述 本数据集包含基于指定文档开发的心脏起搏器软件起搏行为模型,仅捕捉VVI(心室起搏、心室感知、抑制响应)和DDD(双腔起搏、双腔感知、跟踪响应)两种起搏模式。数据还包含一组种子突变体及相关测试输入,用于模型测试研究。 文件详解 文件名称:pacing.zip 文件格式:ZIP...
-
FuseCap_Based_COCO测试集图像描述文本数据_测试版
数据集概述 本数据集包含由FuseCap生成的COCO测试集图像描述文本,核心内容为针对COCO测试集图像的自动生成描述。数据集结构简单,仅含一个JSON格式文件,用于图像描述生成任务的测试场景验证。 文件详解 文件名称:coco_karpathy_test.json 文件格式:JSON...
-
is24_Interspeech2024_欧洲议会录音多语言测试集
数据集概述 本数据集是从欧洲议会会议录音中提取的多语言测试集,用于语言识别和语音识别任务。包含15个多语言音频文件,总时长约2小时56分34秒,覆盖19种语言,经人工核对语言标签时间戳并补充官方文本转录,可支持多语言语音技术的模型测试与评估。 文件详解 文件名称:tst_is24.zip 文件格式:ZIP...
-
R_data_independent_人工数据生成_独立变量分布数据
数据集概述 本数据集为基于R语言生成的人工数据,包含10000行数据和1000个独立变量,通过线性模型生成符合不同分布的因变量Y,包括正态分布、泊松分布和混合正态分布,变量系数根据位置设置不同权重,用于统计建模和数据分析测试。 文件详解 文件名称:data-independent.zip 文件格式:ZIP...
-
Hydrogen_Clusters_Based量子化学多方法参考数据集
数据集概述 本数据集包含针对十二万个随机生成氢簇的高水平量子化学计算数据(CCSD(T)/def2-QZVPP),以及HF、MP2、CCSD等其他理论水平、三种密度泛函(PBE、B3LYP、omegaB97M-V)和四种半经验模型(AM1、PM7、GFN1、GFN2)的计算结果,还包含数据生成与后处理的工作流脚本。 文件详解...
-
Reproduction_Package_多语言跨语言剽窃检测评估复现数据
数据集概述 本数据集为学士学位论文《Multi-Language and Cross-Language Plagiarism Detection》的复现包,包含论文评估所用全部数据,可确保论文结果的持续复现。内容涵盖修改版JPlag工具、评估用数据集及自动化运行脚本,支持多语言和跨语言剽窃检测的技术验证与结果复现。 文件详解...
-
Biografischportaal_nl_荷兰传记文本命名实体识别数据集
数据集概述 本数据集用于荷兰传记文本的命名实体识别,包含六种实体类型(PERSON、LOCATION、ORGANIZATION、DATE、ARTWORK、MISC)的标注。原始数据来源于荷兰传记门户网站,标注文件经人工检查分词和句子拆分,总计包含六个文件。 文件详解...
-
Herbarium_AI_Based法属圭亚那热带植物营养生长动态研究数据
数据集概述 本数据集用于研究人工智能在植物标本馆馆藏中热带植物营养生长动态分析的应用,通过深度学习技术检测标本中罕见的营养生长结构(生长芽),并自动分类其生长类型(连续或节律性),为热带植物物候学研究提供支持。 文件详解 文件名称:herbarium-vegetative-phenology.zip 文件格式:ZIP...
-
stitches_Based_GCIMS项目开发的stitches模型包数据
数据集概述 本数据集包含GCIMS项目开发的"stitches"模型的包数据,数据集仅有一个文件,无目录结构,文件类型为.zip格式,无训练/测试、数据/标签、原始/处理数据的划分,无README或内容预览。 文件详解 文件名称:data.zip 文件格式:ZIP 字段映射介绍:压缩包内包含stitches模型的相关数据,具体内容未提供预览信息...
-
数据2D_Material_Based_二维材料结构衍射图案深度学习重建数据集
数据集概述 本数据集包含用于基于物理敏感深度学习重建二维材料结构的相关数据,具体为数据集、保存的模型参数及测试集,以压缩包形式存储,可支持二维材料结构分析相关的研究与应用。 文件详解 文件名称:dataset_savedmodels_and_testset.zip 文件格式:ZIP...
-
DysRegnetPackage_Testing_Models_基因调控模型测试数据
数据集概述 本数据集包含用于DysRegnetPackage的模型测试数据,涉及肺和乳腺组织的基因调控关系分析。包含2个压缩模型文件和2个过滤后的基因表达数据CSV文件,记录调控基因、靶基因及其权重关系,支持基因调控网络相关的模型测试与分析。 文件详解 压缩模型文件(archive_files)...
-
Severity_Index_Based_AI软件项目技术债务与代码质量指标预测数据
数据集概述 本数据集为AI软件项目Severity Index预测研究的代码与数据文件集合,包含技术债务与代码质量指标处理、模型训练测试及研究问题分析相关内容,涉及基因、实验等语义关键词,共9个文件,涵盖代码、文档、压缩包、数据四类文件类型。 文件详解 代码文件(.ipynb格式,共3个)...
-
MONAI_Bootcamp_2020_Challenge_胸部X光多分类任务数据集
数据集概述 本数据集是MONAI 2020训练营第三天挑战赛的专用数据,用于构建胸部X光图像分类模型。需将图像分为正常(0)、肺炎(1)、新冠患者(2)三类,原始数据来源于多个公开胸部X光数据集,包含训练、测试数据及测试真值文件。 文件详解 训练数据文件 文件名称:training_data.zip 文件格式:ZIP...
-
Schafer_Lab_N2_Based秀丽隐杆线虫野生型标准行为表型完整数据集2010_10_15
数据集概述 本数据集为Schafer Lab于2010年10月15日对标准野生型N2秀丽隐杆线虫(有食物、成年雌雄同体)进行的单虫高分辨率行为记录,包含26267个骨架分段,由Tierpsy软件处理生成轨迹、骨架及数百项行为特征,是国际通用的C. elegans野生型行为基准数据集。 文件详解 文件名称:N2 on food...
-
Serena_Whirlpool_Based医疗CT用例匿名公开数据集PUBLIC
数据集概述 本数据集为Serena Whirlpool项目医疗CT用例的匿名公开版本,用于医疗CT相关分析场景。数据集仅包含一个文件,无目录层级,未划分训练/测试集、数据/标签集或原始/处理集,文件类型单一为Excel格式。 文件详解 文件名称:SERENA prj Extraction for public .xlsx 文件格式:XLSX...
-
GNSS_RO_Supervised_Detection_低纬度电离层闪烁特征数据集_2021
数据集概述 本数据集包含低纬度地区GNSS无线电掩星(GNSS-RO)测量的电离层闪烁标注特征数据,用于训练和测试支持向量机(SVM)算法。该SVM模型可对未标注的测量数据进行二分类:标签1(电离层闪烁)和标签0(其他干扰)。数据集仅包含一个压缩文件,相关方法细节可见2021年提交至《Remote Sensing》的论文。 文件详解 文件名称:sci-...
-
Relation_Extraction_Based_生物与天然产物关系抽取评估数据集_test
数据集概述 本数据集是针对生物与天然产物之间关系的端到端关系抽取任务构建的人工标注评估数据集,包含对化学实体、生物实体及两者间明确关系的结构化标注,为生物信息学领域的关系抽取模型提供测试基准。 文件详解 文件名称:curated_test_set.json 文件格式:JSON 字段映射介绍:包含人工标注的实体与关系信息,主要分为三类标注内容:...



