DomainNet_Based数据湖消歧同形异义词检测数据集

数据集概述

本数据集为论文“DomainNet: Homograph Detection and Understanding in Data Lake Disambiguation”提交所用,包含用于数据湖消歧场景下同形异义词检测与理解的数据集及其图表示,共2个压缩文件,无目录层级结构。

文件详解

  • 压缩文件1
  • 文件名称:graph_representations.zip
  • 文件格式:ZIP
  • 字段映射介绍:包含用于同形异义词检测与理解的图表示数据,具体内容未提供预览
  • 压缩文件2
  • 文件名称:DATA.zip
  • 文件格式:ZIP
  • 字段映射介绍:包含数据湖消歧场景下的同形异义词检测数据集,具体内容未提供预览

数据来源

论文“DomainNet: Homograph Detection and Understanding in Data Lake Disambiguation”

适用场景

  • 数据湖消歧研究: 用于数据湖环境下同形异义词的检测与理解方法开发
  • 同形异义词识别分析: 支持同形异义词检测模型的训练与验证
  • 图表示学习应用: 探究图表示在数据湖同形异义词处理中的作用
  • 数据治理技术研究: 为数据湖数据治理中的语义歧义问题提供数据支撑
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 574.39 MiB
最后更新 2026年1月29日
创建于 2026年1月29日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。