Stack_Overflow_Based_开发者代码使用行为研究编码数据

数据集概述

本数据集为学术论文《How Do Developers Utilize Source Code from Stack Overflow?》的配套编码数据,包含开发者调查响应、开放式回答分类及多语言代码使用编码三类文件,记录了开发者使用Stack Overflow代码的行为特征与相关属性,可用于分析开发者代码复用模式与偏好。

文件详解

  • 文件名称:Survey responses.csv
  • 文件格式:CSV
  • 字段映射介绍:包含开发者软件工程经验年限、项目类型、使用编程语言、Stack Overflow代码使用频率等调查问题的响应数据,以Timestamp(时间戳)为起始字段。
  • 文件名称:Coding - all languages.csv
  • 文件格式:CSV
  • 字段映射介绍:包含file_id(文件ID)、lang(编程语言)、category(final)(最终分类)、category(frank)(Frank分类)、category(shaowei)(Shaowei分类)、from_where(来源)、is_highest(是否最高)、file_url(文件链接)、post_url(帖子链接)、commits(提交次数)、search_code_url(代码搜索链接)等代码使用编码信息。
  • 文件名称:Category on open answers.xlsx
  • 文件格式:XLSX
  • 字段映射介绍:开放式回答的分类数据,具体字段未提供预览信息。

数据来源

论文"How Do Developers Utilize Source Code from Stack Overflow?"

适用场景

  • 开发者行为分析: 研究开发者使用Stack Overflow代码的频率、场景及决策因素。
  • 代码复用模式研究: 分析不同编程语言、项目类型下的代码复用特征与偏好。
  • 开发者调查数据分析: 基于调查响应数据挖掘开发者经验、项目属性与代码使用行为的关联。
  • 学术研究支撑: 为开发者社区代码复用行为相关的学术论文提供实证数据支持。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.51 MiB
最后更新 2026年1月22日
创建于 2026年1月22日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。