-
钟表品牌网站页面深度抓取数据集WatchBrandWebsitePageDepth-jackykutszkin
2025年4月30日 30 25 9
钟表品牌网站页面深度抓取数据集WatchBrandWebsitePageDepth-jackykutszkin 数据来源:互联网公开数据 标签:钟表, 品牌, 网站抓取, 页面深度, 数据爬取, 结构化数据, 市场分析, 品牌研究 数据概述: 该数据集包含来自钟表品牌网站的数据,记录了钟表品牌及其对应的网站页面深度信息。主要特征如下:... -
中国南方航空公司乘客评价数据集
2025年4月15日 30 13 4
中国南方航空公司乘客评价数据集 数据来源:互联网公开数据 标签:中国南方航空公司,乘客评价,航班体验,客户反馈,数据分析,旅行评论,网站抓取 数据概述: 本数据集包含了从Skytrax网站抓取的中国南方航空公司的乘客评价,包括经过验证的旅行评价和未验证的旅行评价。这些评价提供了详实的乘客反馈,涵盖了对航班体验的各个方面。 数据用途概述:... -
网站元素数据集
2025年4月14日 30 18 8
网站元素数据集 数据来源:互联网公开数据 标签:网站抓取,机器学习,标题,段落,广告密度,前端监控,数据分析 数据概述: 本数据集通过使用Google Puppeteer工具抓取自互联网,包含了从网页中提取的标题、段落以及广告密度大于200的广告元素。该数据集旨在为开发能够自动抓取和处理网页元素的机器学习模型提供数据支持。 数据用途概述:... -
中文网站robots-txt数据集
2025年4月14日 30 18 9
中文网站robots-txt数据集 数据来源:互联网公开数据 标签:中文网站,robots.txt,网络爬虫,网站抓取,网络数据,爬虫技术,网站规则 数据概述:... -
沃尔格林药房产品数据集
2025年4月14日 30 25 3
沃尔格林药房产品数据集 数据来源:互联网公开数据 标签:沃尔格林,药品,产品信息,药房连锁,市场分析,药品价格,库存状态,产品描述,成分信息,药品警告,网站抓取 数据概述:... -
书籍分类与信息爬虫数据集
2025年4月14日 30 11 3
书籍分类与信息爬虫数据集 数据来源:互联网公开数据 标签:书籍,分类,信息爬虫,文学数据,网站抓取,数据集 数据概述: 本数据集包含从Books to...