Unicamp_IR_Based_人工与AI主题标引对比数据集

数据集概述

本数据集来自巴西坎皮纳斯州立大学(Unicamp)机构知识库,包含40篇科学文献的人工标引与AI标引对比数据。通过单份Excel文件呈现,分为人工主题标引表和AI可持续发展目标(SDGs)自动分类表,可用于比较人工与AI元数据的概念一致性、术语相关性及分类准确性。

文件详解

  • 文件名称:dataset_automatic_indexing_SDG_IAGeratemas.xlsx
  • 文件格式:XLSX
  • 字段映射介绍:
  • subjects_dataset工作表:记录Unicamp图书馆系统馆员为40篇科学文献手动分配的主题术语,包含文献标识及人工标引的主题字段。
  • sdgs_dataset工作表:记录基于Google Gemini模型的生成式AI工具为相同文献自动分配的可持续发展目标(SDGs)标签,包含文献标识及AI生成的SDG分类字段。

数据来源

巴西坎皮纳斯州立大学(Unicamp)机构知识库

适用场景

  • 学术元数据质量评估:对比人工与AI标引的术语相关性、概念一致性及分类准确性。
  • 图书馆工作流优化:分析AI在学术资源主题标引中的应用潜力与局限性,为图书馆自动化标引流程提供参考。
  • AI分类模型评估:以人工标引为基准,评估基于Google Gemini模型的SDG自动分类工具性能。
  • 可持续发展目标研究:通过AI生成的SDG标签,分析学术文献与联合国可持续发展目标的关联度。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.02 MiB
最后更新 2026年1月28日
创建于 2026年1月28日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。