-
GitHub_Based_代码审查LLM重要性过滤模型训练与预测数据
2026年1月23日 30 83 34
数据集概述 本数据集为722作业项目数据,包含1500条GitHub PR评论标注数据、BERT模型微调代码、训练后的最优模型及评论重要性预测与邮件通知代码,旨在通过LLM模型实现PR评论的重要性过滤,提升代码审查效率。 文件详解 数据文件 文件名称:1500data.xlsx 文件格式:XLSX 字段映射介绍:包含3人标注的1500条GitHub...
-
Semantic_Search_Based_语义搜索文献综述与研究议程数据
2026年1月21日 30 6 1
数据集概述 本数据集为提交至IEEE Access的语义搜索文献综述与研究议程相关数据,包含二十四个文件,涵盖文献引用数据、LDA模型文件、文献库数据等内容,涉及ScienceDirect、Web of Science、IEEE等来源的文献信息及语义分析模型相关文件,为语义搜索领域的研究提供文献支撑与分析基础。 文件详解 文献引用数据文件...
-
欧盟COST行动SARCOS镁基膨胀矿物自修复混凝土第二次实验室间测试程序原始数据及补充材料
2025年12月11日 30 102 4
数据集概述 本数据集为欧盟COST行动SARCOS框架下第二次实验室间测试程序(RRT2)的原始数据及补充材料,聚焦镁基膨胀矿物自修复混凝土技术。包含9个欧洲实验室的测试结果,涉及水渗透性、毛细吸水、裂缝宽度测量等实验数据,用于评估自修复性能。 文件详解 实验数据文件(.xlsx格式,共21个): 如Lab 8 - Crack width and...
-
单层二硫化钼旋转缺陷层级补全数据集
2025年12月9日 30 130 14
数据集概述 本数据集包含研究“通过对称感知进化搜索补全单层二硫化钼(MoS₂)旋转缺陷层级”所涉及的训练模型、数据集分割及结构文件,为该领域的计算材料学研究提供支撑。 文件详解 README:...
-
数字化人文课程服饰项目数据集
2025年9月29日 30 161 127
数字化人文课程服饰项目数据集_Digital_Humanities_Course_Dress_Project_Dataset 数据来源:互联网公开数据 标签:数字化人文, 服饰, 社交媒体, 文本分析, 图像识别, 数据可视化, 课程项目, 文化研究 数据概述:...
-
自然语言处理Zalo排序竞赛数据集NaturalLanguageProcessingZaloRankingCompetitionDataset-anhbu...
2025年5月28日 30 79 77
自然语言处理Zalo排序竞赛数据集NaturalLanguageProcessingZaloRankingCompetitionDataset-anhbuivuongtam 数据来源:互联网公开数据 标签:自然语言处理, 文本排序, 机器学习, 深度学习, 文本分类, 机器翻译, 数据竞赛, Transformer 数据概述:...



