水研究领域科学出版物信息检索测试集

数据集概述

该数据集包含水研究交叉领域的科学出版物信息检索测试集,分为ThWIC-Chemistry和ThWIC-Hierarchy两个子数据集。提供领域标签和属性标签,可用于衡量数据子集的主题多样性及属性代表性,为信息检索研究提供测试资源。

文件详解

  • 文件名称:ThWIC_Datasets_description.pdf
  • 文件格式:PDF
  • 内容说明:数据集描述文档,可能包含数据集构建方法、结构及使用说明
  • 文件名称:thwic_datasets.zip
  • 文件格式:ZIP
  • 内容说明:压缩包文件,可能包含数据集核心内容,如文献DOI、查询需求、相关性判断、主题层级及标签数据

适用场景

  • 信息检索算法测试:用于评估检索系统在水研究领域的性能
  • 主题多样性分析:基于标签数据研究水科学文献的主题分布特征
  • 层级分类研究:利用主题层级数据开展文献分类或知识组织相关研究
  • 跨学科信息检索研究:探索水研究交叉领域的检索策略优化
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 3.52 MiB
最后更新 2025年12月22日
创建于 2025年12月22日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。