API文档类型间信息对应数据集

数据集概述

本数据集为《API文档类型间信息对应》论文的在线附录,包含API文档信息分类的编码指南、标注的样本句子及不同语言主题的标注句子数据,用于支持API文档信息对应关系的研究与分析。

文件详解

  • 文件名称: CodingGuide.pdf
  • 文件格式: PDF
  • 内容说明: 用于将句子分类为“API信息”或“辅助文本”的编码指南文档
  • 文件名称: annotated_sampled_sentences.csv
  • 文件格式: CSV
  • 内容说明: 包含332条样本句子及两组标注(第一作者标注、外部标注者标注),用于计算论文中报告的一致性分数
  • 字段示例: 句子文本、第一作者标注、外部标注者标注
  • 文件名称: -.csv(如Python-REGEX.csv、Java-IO.csv等)
  • 文件格式: CSV
  • 内容说明: 特定语言(如Python、Java)特定主题(如REGEX、IO)教程中的标注句子数据,包含预处理后的句子、源文件、与参考文档的句子对应关系标注
  • 字段示例: File Name(源文件名)、Text(句子文本)、Position in File(文件中的位置)、Related to API(是否与API相关)、Match Type(匹配类型)、Matched API Ref Doc Text(匹配的API参考文档文本)

适用场景

  • API文档信息对应关系研究: 分析不同类型API文档(教程、参考文档)间的信息一致性与对应模式
  • 自然语言处理应用: 基于标注句子数据训练或验证文本分类、信息匹配等NLP模型
  • 软件工程实证研究: 验证API文档信息分类编码指南的有效性,计算标注者间一致性
  • API文档质量评估: 探究API教程与参考文档间的信息互补性与完整性
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.87 MiB
最后更新 2025年12月16日
创建于 2025年12月16日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。