-
C和C_内存不安全问题的模糊测试与静态分析工具对比研究数据集
2025年12月22日 30 42 8
数据集概述 本数据集包含针对C和C++内存不安全问题的模糊测试(DAST)与静态分析(SAST)安全工具对比评估的分析脚本,为相关安全工具的性能研究提供支持。 文件详解 文件名称: fuzzing-vs-static-artifact-main.zip 文件格式: ZIP (.zip) 内容说明:...
-
C语言反编译器保真度问题分类数据集
2025年12月13日 30 148 85
数据集概述 本数据集为USENIX Security论文《A Taxonomy of C Decompiler Fidelity Issues》的补充材料,包含所有编码示例、反编译器对比摘要表及分类代码手册,用于研究C语言反编译器的保真度问题。 文件详解 文件名称: codebook.pdf 文件格式: PDF 内容说明:...
-
大语言模型代码助手安全性用户研究数据集2022
2025年12月11日 30 82 42
数据集概述 本数据集为2022年开展的大语言模型代码助手安全性用户研究结果,聚焦分析使用GitHub Copilot类代码助手(基于OpenAI code-cushman-001模型)的用户与未使用者在C语言代码中产生内存相关安全漏洞的差异,通过受控环境下的编程任务收集数据。 文件详解 文件名称: llm-user-study-for-...
-
CM1_NASA航天器仪器C语言源代码数据集
2025年12月6日 30 161 98
数据集概述 该数据集包含NASA航天器仪器CM1的数据收集与处理模块的C语言源代码。CM1作为NASA的航天器仪器,其源代码曾被研究者获取用于分析,如西弗吉尼亚大学基于该代码反向工程生成UML模型,数据集为研究航天器仪器软件实现提供了基础资料。 文件详解 文件名称:cm1.zip 文件格式:ZIP压缩包(.zip)...
-
C文件的JSON抽象语法树数据集
2025年12月4日 30 55 36
数据集概述 本数据集提供了一个C语言文件的抽象语法树(AST),以JSON格式存储。该C文件是从Software Heritage平台的热门代码片段中,依据AST大小随机选取的,为代码结构分析提供基础数据。 文件详解 文件名称: ast.json 文件格式: JSON (.json) 内容说明:...
-
SecureCC源代码漏洞检测数据集-2021年-cerengen
2025年6月1日 30 76 20
SecureCC源代码漏洞检测数据集-2021年-cerengen 数据来源:互联网公开数据 标签:SecureC,漏洞检测,C语言,源代码,安全,数据集,代码模板 数据概述: 本数据集是一个结合了SARD-Juliet数据集、Draper...
-
Python解释器源码及相关工具集PythonInterpreterSourceCodeandTools-soumochatterjee
2025年5月31日 30 18 4
Python解释器源码及相关工具集PythonInterpreterSourceCodeandTools-soumochatterjee 数据来源:互联网公开数据 标签:Python, 编程语言, 解释器, 源码, C语言, 编译, 调试, 工具 数据概述:...
-
软件代码变更语义分析语料库SoftwareCodeChangeSemanticAnalysisCorpus-zheungyik2015
2025年5月12日 30 99 5
软件代码变更语义分析语料库SoftwareCodeChangeSemanticAnalysisCorpus-zheungyik2015 数据来源:互联网公开数据 标签:代码变更, 语义分析, 软件工程, 机器学习, 文本挖掘, Java, C语言, 语料库 数据概述:...
-
代码生成与风格转换C语言程序数据集CodeGenerationandStyleConversionCLanguagePrograms-kislovka
2025年5月1日 30 194 49
代码生成与风格转换C语言程序数据集CodeGenerationandStyleConversionCLanguagePrograms-kislovka 数据来源:互联网公开数据 标签:代码生成, C语言, 程序风格转换, 文本生成, 软件工程, 机器学习, 代码优化, 数据集 数据概述:...
-
代码美化工具C语言代码数据集CodeBeautifierCLanguageCodeDataset-bekhtinav
2025年5月1日 30 49 25
代码美化工具C语言代码数据集CodeBeautifierCLanguageCodeDataset-bekhtinav 数据来源:互联网公开数据 标签:C语言, 代码美化, 源代码, 文本分析, 编程, 软件工程, 数据集, 代码风格 数据概述: 该数据集包含来自bekhtinav-...
-
编程代码漏洞检测C语言代码数据集ProgrammingCodeVulnerabilityDetectionCLanguageCode-kislovka
2025年4月30日 30 50 37
编程代码漏洞检测C语言代码数据集ProgrammingCodeVulnerabilityDetectionCLanguageCode-kislovka 数据来源:互联网公开数据 标签:代码漏洞, C语言, 静态分析, 安全检测, 软件安全, 代码审计, 机器学习, 编译 数据概述: 该数据集包含C语言源代码,记录了可能存在漏洞的代码片段。主要特征如下:...
-
编程学习C语言代码片段数据集ProgrammingLearningCLanguageCodeSnippets-bekhtinav
2025年4月29日 30 103 33
编程学习C语言代码片段数据集ProgrammingLearningCLanguageCodeSnippets-bekhtinav 数据来源:互联网公开数据 标签:C语言, 编程学习, 代码示例, 教育, 算法, 数据集, 文本分析, 程序设计 数据概述: 该数据集包含C语言代码片段,记录了用于教学和学习编程的经典代码示例。主要特征如下:...
-
CodeLlama-7b-hf模型C语言代码生成数据集-代码反编译任务
2025年4月24日 30 137 55
CodeLlama-7b-hf模型C语言代码生成数据集-代码反编译任务 数据来源:互联网公开数据 标签:代码生成, C语言, 反编译, CodeLlama, 机器学习, 软件工程, Hex-Rays, Form AI Dataset 数据概述: 本数据集用于微调CodeLlama-7b-hf模型,旨在训练模型根据Hex-...



