ENwikIR1k_维基百科检索开发数据完整集合

数据集概述

该数据集是通过wikIR工具获取的开发数据集,包含一个压缩文件,未进行训练/测试、数据/标签或原始/处理的拆分,为相关研究提供基础数据支持。

文件详解

  • 文件名称: wikIR1k.zip
  • 文件格式: ZIP (.zip)
  • 内容说明: 压缩包内包含通过wikIR工具获取的开发数据集内容,具体字段及结构未提供预览信息

适用场景

  • 信息检索模型开发: 可用于构建和测试基于维基百科相关数据的信息检索算法
  • 自然语言处理研究: 适用于文本匹配、文档检索等NLP任务的模型训练与验证
  • 数据挖掘实验: 可作为基础数据集,用于探索文本数据处理及检索效率优化方法
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 157.35 MiB
最后更新 2025年12月7日
创建于 2025年12月7日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。