SM01_制造业多语言网络知识抽取初步调查结果与结构图表

数据集概述

本数据集为SM01研究项目的初步调查成果,包含制造业多语言网络知识抽取相关的调查表格、样本网站抓取报告及链接路径结构图表,覆盖样本抓取、人工审核及筛选分析等核心内容。

文件详解

  • ManualReviewOf37DomainsInSample.xlsx:Excel格式文件,记录对样本集中37个网站的人工审核数据
  • PrimarySampleCrawlReport.zip:压缩包文件,包含初步样本抓取的报告数据
  • PrimarySampleList.ods:ODS格式文件,存储初步样本网站列表
  • LinkStructureGraphs.zip:压缩包文件,包含链接路径结构图表数据
  • TheFilteredSampleAnalysis.xlsx:Excel格式文件,记录筛选后样本的分析结果

适用场景

  • 制造业语义爬虫研究:分析多语言网络环境下知识抽取的样本设计与抓取策略
  • 网络链接结构分析:探究制造业网站的链接路径特征与信息组织模式
  • 数据预处理优化:基于样本筛选与人工审核数据,优化网络数据过滤流程
  • 知识工程应用:为制造业领域多语言网络知识抽取模型训练提供数据参考
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 26.05 MiB
最后更新 2025年11月27日
创建于 2025年11月27日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。