找到240个数据集

标签: GitHub

过滤结果
  • IMP_MARL_Based多智能体强化学习环境实验数据集

    2026年1月30日   

    数据集概述 本数据集为IMP-MARL多智能体强化学习实验数据集,包含三种环境(struct_uc、struct_c、owf)下七种MARL方法的实验日志、最优智能体网络权重及启发式策略日志。数据支持多智能体强化学习算法性能评估与对比分析,共包含四个文件,以压缩包和文档为主。 文件详解 MARL_logs.zip 文件格式:ZIP...
    packageimg
  • LogOracle_LogTCP_Based日志测试数据集

    2026年1月29日   

    数据集概述 本数据集为LogOracle和LogTCP所使用的日志测试数据集,以压缩包形式提供,未包含训练/测试、数据/标签或原始/处理等数据划分,无README或内容预览文档,可用于日志相关的测试研究与分析。 文件详解 压缩包文件 文件名称:dataset.zip 文件格式:ZIP...
    packageimg
  • SIMPITIKI_GITHUB_意大利语文本简化语料库数据

    2026年1月29日   

    数据集概述 本数据集为意大利语文本简化语料库SIMPITIKI,包含两组简化文本对:第一组通过半自动方式从意大利语维基百科获取,第二组从行政领域文档中逐句手动标注。数据集仅含一个XML格式文件,无训练测试、数据标签或原始处理数据的划分。 文件详解 文件名称:simpitiki-v2.xml 文件格式:XML...
    packageimg
  • Isaac_Sim_Based_多臂机器人平台数字孪生合成数据

    2026年1月29日   

    数据集概述 本数据集为基于Isaac Sim构建的多臂机器人平台数字孪生相关数据,用于合成数据生成。数据与AISciencePlatform的icra2023_synthetic_data_pretraining_for_robotics仓库相关联,包含一个压缩文件,可支持机器人学领域的合成数据研究与应用。 文件详解 文件名称:data.zip...
    packageimg
  • Sapporo_nf_core_rnaseq工作流执行结果数据

    2026年1月29日   

    数据集概述 本数据集为Sapporo平台上运行nf-core/rnaseq工作流产生的执行结果,包含1个压缩文件,无目录层级结构,未检测到训练/测试、数据/标签或原始/处理数据的拆分,主要用于RNA测序分析工作流的结果存档与查看。 文件详解 文件名称:nfcore_rnaseq_results.zip 文件格式:ZIP 字段映射介绍:压缩包内包含nf-...
    packageimg
  • U_TAE_PASTIS_Based语义分割模型预训练权重数据

    2026年1月29日   

    数据集概述 本数据集包含U-TAE模型在PASTIS数据集上针对语义分割任务的预训练权重,可用于语义分割相关任务的模型初始化或迁移学习,帮助提升模型在特定场景下的性能。数据集仅含一个压缩文件。 文件详解 文件名称:UTAE_SemanticSeg_weights.zip 文件格式:ZIP 字段映射介绍:压缩包内包含U-...
    packageimg
  • CEDS_Based_网格化排放数据文档_2024_11_25

    2026年1月28日   

    数据集概述 本数据集是CEDS v_2024_11_25版本0.5度网格化排放数据的文档占位符,通过ESGF发布。该版本修正了CEDS v_2024_10_21版本中被修订替换的文件,包含排放数据的访问说明、数据说明及网格化诊断文件,数据源自CEDS v_2024_07_08的综合排放数据。 文件详解 CEDS v_2024_11_25...
    packageimg
  • smmorey_基于莫雷等人2022年的补充数据集_v1_1_0

    2026年1月28日   

    数据集概述 本数据集为Morey_et_al_2022的补充数据集,版本号v1.1.0,包含1个压缩文件,无训练/测试、数据/标签、原始/处理数据的拆分,目录深度为1层,主要用于科研论文相关的补充数据共享。 文件详解 文件名称:smmorey/Morey_et_al_2022_SupplementalDataSets-v1.1.0.zip...
    packageimg
  • GitHub_Test_Reviews_开发者测试评审分析数据集

    2026年1月28日   

    数据集概述 本数据集记录了GitHub平台上330条测试相关的代码评审数据,包含40个评审建议、16个请求类别、8个响应类别,以及13个拉取请求和评论特征。数据集通过结构化字段整合了项目信息、评审内容、测试类型等维度,为分析开发者测试评审行为提供支持。 文件详解 文件名称:Test Reviews v1.csv 文件格式:CSV...
    packageimg
  • Byrd_Polar_冰芯古气候研究标准化Excel数据集_存档版

    2026年1月27日   

    数据集概述 本数据集是伯德极地与气候研究中心冰芯古气候研究组自1980年代以来收集的16个以上冰芯记录的标准化存档,包含19个Excel格式文件。原NOAA-NCEI数据库中存档文件格式不一致,本数据集通过统一格式优化,便于研究人员下载和聚合多数据集开展研究,可通过GitHub的Byrd-ICP Data App在MATLAB中直接访问。 文件详解...
    packageimg
  • TD_Temporality_技术债务引入时间性与影响因素分析数据

    2026年1月27日   

    数据集概述 本数据集为技术债务(TD)引入时间性研究的配套数据,基于47个开源项目(来自Apache、Eclipse生态及GitHub独立项目),通过6个月滑动时间窗口分析新代码中TD问题的引入规律,以及开发团队工作量、开发者经验等因素与TD引入的关联。 文件详解 文件名称:SQJ2021.xlsx 文件格式:XLSX...
    packageimg
  • effechecka_Based_阿尔及利亚物种名录数据_2017

    2026年1月27日   

    数据集概述 本数据集为2017年阿尔及利亚物种名录,通过effechecka工具结合简化版geonames多边形数据采集,包含该国及部分行政区域的分类单元列表,支持生物多样性相关研究,仅含一个压缩文件。 文件详解 文件名称:algeria.zip 文件格式:ZIP...
    packageimg
  • SSL_Metrics_GitHub科研软件项目指标数据集_2021

    2026年1月26日   

    数据集概述 本数据集为从GitHub科研软件项目中挖掘的SSL指标数据,包含16个JSON格式文件,覆盖coursedescriptions、sympy、yolov3、yolov5、simbody、ipython、astropy、numpy等项目的GitHub Issues和Git...
    packageimg
  • GitHub_Project_Based开源软件许可证分析数据集1_0

    2026年1月26日   

    数据集概述 本数据集包含多组GitHub开源项目信息,覆盖PHP、Java、JavaScript、C、C++、C#、Python、Visual Basic八种编程语言。数据用于支持FOSSology Nomos、Ninka等许可证提取工具分析源代码中的开源软件许可证,同时可对项目README.md文件进行分析以发现库中使用的许可证。 文件详解...
    packageimg
  • Fire_Drill_v8_Based_15个真实项目反模式检测数据集

    2026年1月26日   

    数据集概述 本数据集包含15个真实软件项目的相关制品,用于支持Fire Drill反模式的检测研究。数据涵盖原始项目资料、反模式存在与否及强度的基准真值、问题跟踪数据、源代码密度数据、检测模型代码及实验文档等,对应技术报告v8版本,支持通过问题跟踪数据和源代码两种检测方法。 文件详解 文件名称:Fire-Drill-detection.zip...
    packageimg
  • arXiv_1702_04117_Based骨细胞网络连接组学研究数据

    2026年1月26日   

    数据集概述 本数据集包含小鼠编织骨和绵羊纤维板层骨中骨细胞陷窝-小管网络的原始共聚焦图像堆栈,对应arXiv论文“骨细胞的小世界:骨陷窝-小管网络的连接组学”。数据集仅含一个压缩文件,可结合GitHub提供的MATLAB代码复现论文图表。 文件详解 文件名称:Data.zip 文件格式:ZIP...
    packageimg
  • Benford_GitHub_Benford定律泥石流检测研究支持材料

    2026年1月26日   

    数据集概述 本数据集是论文“Benford's law as debris flow detector in seismic signals”的支持材料,包含随机森林模型源代码、训练好的模型文件、58个泥石流事件的特征图及拟合曲线压缩包,以及事件详情与拟合参数表格,共4个文件,用于支持基于Benford定律的地震信号泥石流检测研究。 文件详解...
    packageimg
  • Reactions_Based开源社区用户反应模式与行为特征研究数据

    2026年1月25日   

    数据集概述 本数据集围绕GitHub Reactions功能展开,旨在研究开源社区用户反应的使用模式、资源类型偏好、季节性影响及开发者角色差异。通过分析用户反应行为,为社区维护者理解成员行为、研究者构建支持工具提供数据支撑,包含项目说明、数据备份及分析代码三类文件。 文件详解 README.md 文件格式:MD...
    packageimg
  • GitHub_Based_代码审查LLM重要性过滤模型训练与预测数据

    2026年1月23日   

    数据集概述 本数据集为722作业项目数据,包含1500条GitHub PR评论标注数据、BERT模型微调代码、训练后的最优模型及评论重要性预测与邮件通知代码,旨在通过LLM模型实现PR评论的重要性过滤,提升代码审查效率。 文件详解 数据文件 文件名称:1500data.xlsx 文件格式:XLSX 字段映射介绍:包含3人标注的1500条GitHub...
    packageimg
  • Gitome_MSR2024_GitHub_README相关任务数据集

    2026年1月23日   

    数据集概述 本数据集为Gitome,是一个用于GitHub README相关任务的精选数据集,包含数据模型、现有数据集、语言统计、主题统计、仓库列表等9个文件,支持MSR2024会议论文的实验结果复现,可用于GitHub README相关的数据分析与任务研究。 文件详解 emf_metamodel.zip 文件格式:ZIP...
    packageimg