找到240个数据集

标签: GitHub

过滤结果
  • ThoughtSource_Based_大语言模型推理数据中心代码快照

    2026年1月23日   

    数据集概述 本数据集是ThoughtSource的代码快照,ThoughtSource是面向大语言模型思维链推理的元数据集与软件库。数据集包含一个文件,无目录结构,未划分训练/测试、数据/标签或原始/处理数据,文件类型单一为压缩包。 文件详解 文件名称:ThoughtSource-main.zip 文件格式:ZIP...
    packageimg
  • GitHub_Based_软件部分修复程序识别与完整修复建议基准数据集

    2026年1月22日   

    数据集概述 本数据集是用于自动化程序修复工具的真实世界基准任务集合,聚焦于识别部分修复(Partial Fixes)并生成完整修复方案。通过GitHub API获取候选闭源问题,结合重新打开的问题及CI状态筛选策略,构建了包含超2000个部分修复案例的基准集,为相关工具提供测试与优化支撑。 文件详解 文件名称:partial-fix.zip...
    packageimg
  • FuncProtDecode_Source_蛋白质功能解码研究补充数据

    2026年1月22日   

    数据集概述 本数据集为FuncProtDecode项目的补充数据文件,包含两个文件,分别为压缩包和Excel表格,用于支持相关研究的数据分析与验证。数据由代码生成,代码可通过指定链接获取,整体无训练测试、数据标签或原始处理数据的划分。 文件详解 SUPPLEMENTARY_files.zip 文件格式:ZIP...
    packageimg
  • GAME_Based_Gosai_2024基因组API模型评估器容器数据

    2026年1月22日   

    数据集概述 本数据集为Gosai等人2024年研究中使用的基因组API模型评估器(GAME)容器相关数据,包含776,474条200bp的MPRA序列(在3种人类细胞系中测量),提供评估器容器、测试预测器容器及相关数据文件,用于基因组模型评估流程的部署与验证。 文件详解 evaluator_data.zip 文件格式:ZIP...
    packageimg
  • PCaWGS_GitHub_Source_前列腺癌细胞系过滤注释变异数据

    2026年1月22日   

    数据集概述 本数据集包含PC3和LNCaP人前列腺癌细胞系的过滤注释单核苷酸变异(SNV)和短插入缺失(indel)变异数据。通过Illumina HiSeqX测序,经比对、变异检测、公共数据库过滤及SnpEff注释处理,区分细胞系特有及共享变异,共3个压缩文件。 文件详解 LNCaP-private-0001.vcf.snpeff.zip...
    packageimg
  • CoronaCentral_Source_生物医学多类型实体术语列表数据

    2026年1月21日   

    数据集概述 本数据集为CoronaCentral系统使用的术语列表,包含基因、药物、冠状病毒蛋白、症状等多种生物医学实体的名称、同义词及标识符,共7个JSON文件,用于支持生物医学领域的实体识别与关联分析。 文件详解...
    packageimg
  • suecharo_Based_Yevis工作流配置与执行文件集_data

    2026年1月21日   

    数据集概述 本数据集为suecharo/yevis-getting-started项目的工作流文件集,包含8个文件,覆盖配置文件、工作流定义文件、示例数据文件等类型。核心用途为支持Yevis工作流注册库的构建与维护,可用于工作流元数据生成、验证、测试执行及关联文件上传等操作。 文件详解 文档文件 文件名称:README.md 文件格式:MD...
    packageimg
  • HMA_Based_High_Mountain_Asia水电设施清单数据

    2026年1月21日   

    数据集概述 本数据集为High Mountain Asia(HMA)区域的水电设施清单,支持论文“Accelerating River Discharge in High Mountain Asia”研究。数据来源于GitHub仓库,包含一份Excel文件,可用于分析该区域水电设施分布及相关研究。 文件详解...
    packageimg
  • Dataset_PuppetIssues_Mining_数据集_2024

    2026年1月21日   

    数据集概述 本数据集围绕Puppet相关问题挖掘展开,包含3个文件,涉及Puppet问题数据、挖掘代码及相关数据文件。数据无目录层级,文件类型多样,涵盖.xlsx、.py、.csv格式,主要用于Puppet问题的分析与挖掘。 文件详解 PuppetIssues.xlsx 文件格式:.xlsx...
    packageimg
  • gp_net_Based_基于熵的图神经网络主动学习材料性能实验复现数据

    2026年1月21日   

    数据集概述 本数据集包含复现论文“Entropy based active learning of graph neural networks for materials properties”所需的全部数据与模型文件,包括训练数据、训练好的Megnet模型参数、主动学习结果、潜空间向量及可视化代码等,支持材料性能预测实验的复现与分析,共含18个文件。...
    packageimg
  • NL2Fix_Supplementary_LLM漏洞修复评估补充材料数据

    2026年1月21日   

    数据集概述 本数据集是论文“NL2Fix: Evaluating LLMs for Resolving Bugs From Natural Language Intent”的补充材料,包含两个压缩文件,涉及代码漏洞修复相关的嵌入数据和生成补丁数据,为LLM在自然语言意图驱动的漏洞修复任务中的评估提供支持。 文件详解 压缩文件包...
    packageimg
  • GitHub_Human_centric_用户中心问题讨论标注数据集2021

    2026年1月20日   

    数据集概述 本数据集为人工标注的用户中心问题讨论数据,包含从6个GitHub仓库中随机选取的1244条问题评论。数据聚焦于GitHub平台上多样化的用户中心问题讨论,为研究代码协作平台中的用户需求提供结构化标注资源,仅包含一个文件。 文件详解 文件名称:Human-centric-issues-GitHub-552021.xlsx 文件格式:XLSX...
    packageimg
  • EntoGEM_GITHUB_昆虫衰退研究对比初步结果数据2020_05_06

    2026年1月19日   

    数据集概述 本数据集为EntoGEM项目2020年5月6日发布的初步结果,包含该项目识别的10年以上昆虫研究与2019-2020年53篇提及“昆虫衰退”的文献(含文章、评论、元分析等)的参考文献对比数据,是社区驱动综合研究的阶段性验证数据。 文件详解 归档文件1 文件名称:preliminary_results-2020_05_06.zip...
    packageimg
  • GitHub_Based_OSS项目初始生态指标与长期流行度关系探索研究数据集

    2026年1月19日   

    数据集概述 本数据集为论文“On the Relationships between the Initial Ecology Indicators of OSS Projects and Their Long-Term Popularity: An Exploratory Study on GitHub”的复现包,包含从GitHub...
    packageimg
  • eimd_sswd_Based_海星消耗病免疫与神经系统响应补充数据_v1_1

    2026年1月19日   

    数据集概述 本数据集为论文《Up in arms: Immune and nervous system response to sea star wasting disease》的补充数据,包含可本地下载并交互式执行的Jupyter Notebooks及相关数据,用于复现论文中的分析过程,仅含一个压缩文件。 文件详解 文件名称:eimd-...
    packageimg
  • Floralens_Source_葡萄牙本土植物深度学习模型补充材料_0_2版

    2026年1月19日   

    数据集概述 本数据集是论文《Floralens: a Deep Learning Model for the Portuguese Native Flora》的补充材料,包含支持该深度学习模型的相关数据,由CRACS/INESC-TEC和DCC/FCUP的研究人员共同开发,可通过GitHub访问浏览。 文件详解 文件名称:floralens-...
    packageimg
  • arnaugiribet_scrapings_塔拉戈纳港2019年船舶停靠数据集

    2026年1月19日   

    数据集概述 本数据集记录了2019年西班牙塔拉戈纳港的船舶停靠信息,通过网络爬虫工具从指定仓库获取,包含一份结构化表格文件,可用于港口运营分析和船舶活动统计。 文件详解 文件名称:Escales Vaixells_2019.xlsx 文件格式:XLSX 字段映射介绍:未提供具体字段信息,推测包含船舶停靠相关的核心数据(如船舶信息、停靠时间、停靠类型等)...
    packageimg
  • National_Checklists_Based_直布罗陀物种名录数据_2017

    2026年1月18日   

    数据集概述 本数据集为2017年直布罗陀物种名录,是通过effechecka工具利用简化版geonames多边形从各国及部分行政区域提取的分类群列表。数据以压缩文件形式提供,包含直布罗陀地区的物种名录信息,可用于生物多样性研究与区域物种分布分析。 文件详解 文件名称:gibraltar.zip 文件格式:ZIP...
    packageimg
  • ILS_Ceramide_Ring_Trial_人血浆参考物质神经酰胺浓度标准化数据

    2026年1月18日   

    数据集概述 本数据集为ILS神经酰胺环试验(ILS Ceramide Ring Trial)的一部分,包含采用标准操作程序(SOP)测定的人血浆参考物质中神经酰胺浓度的实验室间比对数据。数据通过真实标准品获取,以mzML格式存储,可用于神经酰胺检测方法的标准化验证与比对。 文件详解 文件名称:Lab_23_SOP.zip 文件格式:ZIP(压缩包)...
    packageimg
  • TOSEM_Replication_基于GitHub拉取请求反应的实证研究复现包数据

    2026年1月18日   

    数据集概述 本数据集是TOSEM论文《GitHub拉取请求反应的实证研究》的复现包,包含从GitHub平台前一万个星标最多的仓库及六个选定仓库(Cataclysm-DDA、Julia、Laravel、Node、RPCS3、Rust)收集的原始数据,以及用于数据收集、分析和论文图表生成的源代码,支持研究结果的完整复现。 文件详解...
    packageimg