数据集概述
该数据集是《HESML: a scalable ontology-based semantic similarity measures library with a set of reproducible experiments and a replication dataset》论文的补充材料,包含用于复现WordNet词汇相似度实验的ReproZip文件及原始输出文件压缩包,支持复现三篇相关论文中的实验结果。
文件详解
该数据集包含2个文件,具体说明如下:
- 核心复现文件:
- HESMLv1r1_reproducible_exps.rpz: ReproZip格式文件,用于精确复现三篇论文中基于WordNet的词汇相似度实验调查
- 原始输出文件压缩包:
- RawOutputFiles.zip: ZIP格式压缩包,可能包含实验的原始输出数据
适用场景
- 自然语言处理研究: 复现WordNet词汇相似度实验,验证信息内容(IC)模型及语义相似度计算方法的效果
- 语义计算方法对比: 基于实验数据对比不同词汇相似度计算模型的性能差异
- 可复现性研究: 作为ReproZip工具在学术实验复现中应用的案例参考
- 本体语义分析: 支持基于WordNet本体的词汇语义关系研究与验证