数据集概述
本数据集包含从三个StackExchange站点采集的779条开发者关于软件制品中秘密提交的问题,以及434条对应的已接受答案。数据围绕开发者避免秘密提交的挑战展开,覆盖问题基本信息、内容、标签及互动数据,为分析开发者秘密管理痛点提供支撑。
文件详解
- 主文件
- 文件名称:setu1421/ICSE-2023-Artifacts-v0.5.zip
- 文件格式:ZIP
- 字段映射介绍:包含问题核心字段,如Id(唯一标识)、Title(标题)、Body(描述)、Tags(标签)、CreationDate(发布日期)、Score(点赞数)、ViewCount(浏览量)、AnswerCount(回答数)、CommentCount(评论数)、FavouriteCount(收藏数)、ClosedDate(关闭日期)、URL(链接)、AcceptedAnswerId(已接受答案标识)、Answer(已接受答案内容)
适用场景
- 软件安全研究: 分析开发者在秘密提交管理中面临的常见问题与解决方案偏好
- 开发者行为分析: 探究开发者对秘密提交风险的认知及求助行为特征
- 安全工具需求挖掘: 基于问题痛点识别开发者对秘密检测与防护工具的功能需求
- 软件安全培训优化: 针对高频问题设计开发者秘密管理培训内容与案例