找到2个数据集

标签: 自监督预训练

过滤结果
  • MuGNN_Based_Java_API误用检测框架数据_Archive

    2026年1月22日 30 117 57

    数据集概述 本数据集包含MuGNN框架相关数据,MuGNN是基于图神经网络和聚类的Java API误用检测框架,通过自定义API流图(AFG)捕获代码执行、数据及控制流,结合自监督预训练与聚类分析API使用模式,识别潜在误用,数据集以压缩包形式提供。 文件详解 文件名称:MuGNN-ISSTA.zip 文件格式:ZIP...
    packageimg
  • 数据19世纪法国商业名录数据集

    2025年12月23日 30 45 41

    数据集概述 该数据集包含1798至1861年间法国商业名录的页面与条目,分为标注数据集(8765条人工修正条目)和未标注数据集(1058196条原始条目),用于评估19世纪法语文档的OCR与NER性能。 文件详解 文件名称: README.md 文件格式: Markdown(.md) 内容: 数据集概述、引用方式、使用许可等说明文档 文件名称:...
    packageimg