大语言模型替代软件工程制品人工标注研究数据集

本数据集围绕“大语言模型能否替代软件工程制品人工标注”的研究主题构建，包含实验所需的代码脚本、结果数据、可视化脚本及示例提示词文件，支持复现不同模型在多种软件工程任务中的标注效果对比实验。

压缩包文件（共6个，.zip格式）：
semantic_similarity.zip、SA.zip、name_value_inconsistency.zip、code_summarization_adequacy_conciseness.zip、code_summarization_accuracy_similarity.zip、causality.zip：分别对应不同软件工程任务的数据集压缩包
代码文件（共3个，.py格式）：
majority.py：用于生成论文Figure 6的脚本
scatter.py：用于生成论文Figure 6的脚本
probability.py：用于生成论文Figure 12的脚本
文档文件（共1个，.pdf格式）：
Prompts.pdf：包含所有数据集的示例提示词

数据与资源

字段	值
作者	Maxj
版本	1
数据集大小	62.35 MiB
最后更新	2025年12月21日
创建于	2025年12月21日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。