找到77个数据集

标签: 网络爬虫

过滤结果
  • 网页抓取数据提取数据集WebScrapingDataExtractionDataset-muhammadusman996

    2025年4月22日   

    网页抓取数据提取数据集WebScrapingDataExtractionDataset-muhammadusman996 数据来源:互联网公开数据 标签:网页抓取,数据提取,数据集,网络爬虫,数据分析,信息检索,互联网研究,公开数据 数据概述: 该数据集通过网页抓取技术从多个互联网网站提取信息,记录了各类网页内容的数据。主要特征如下:...
    packageimg
  • 网络语义解析数据集第一部分-2023-swaroopnath6

    2025年4月22日   

    网络语义解析数据集第一部分-2023-swaroopnath6 数据来源:互联网公开数据 标签:网络语义解析,数据集,网络爬虫,信息提取,文本处理,网站解析 数据概述: 本数据集旨在将网站上的相关信息解析为易于理解的文本格式,帮助用户从海量互联网信息中提取出重要数据。数据集包含了从多个信息网站中提取的各种HTML标签特征。...
    packageimg
  • iHerb运动产品品牌-价格与用户评价数据集-roaabader

    2025年4月22日   

    iHerb运动产品品牌-价格与用户评价数据集-roaabader 数据来源:互联网公开数据 标签:iHerb,运动产品,品牌,价格,用户评价,评分,评论数,网络爬虫,数据分析 数据概述:...
    packageimg
  • PDFDrive电子书下载与元数据分析数据集-2023年5月-nahidcse

    2025年4月21日   

    PDFDrive电子书下载与元数据分析数据集-2023年5月-nahidcse 数据来源:互联网公开数据 标签:电子书,PDFDrive,下载量,元数据,图书,阅读,出版,网络爬虫 数据概述:...
    packageimg
  • Avvo律师医生职业资料数据集-2023年-PromptCloudHQ

    2025年4月21日   

    Avvo律师医生职业资料数据集-2023年-PromptCloudHQ 数据来源:互联网公开数据 标签:Avvo,律师,医生,职业资料,数据分析,行业研究,用户评价,网络爬虫,职业分类 数据概述:...
    packageimg
  • 电影数据分析与用户评价数据集-电影信息与评论汇总

    2025年4月15日   

    电影数据分析与用户评价数据集-电影信息与评论汇总 数据来源:互联网公开数据 标签:电影,评论,影评,演员,剧情,用户评价,数据挖掘,网络爬虫 数据概述: 本数据集包含了4000部电影的详细信息,数据来源于网络爬取。通过网络爬虫技术,获取了每部电影的演员阵容、剧情摘要、用户评论等关键数据,构建了一个全面的电影信息数据库。 数据用途概述:...
    packageimg
  • 亚马逊土耳其畅销品数据集

    2025年4月15日   

    亚马逊土耳其畅销品数据集 数据来源:互联网公开数据 标签:亚马逊土耳其,畅销品,价格,产品评分,视觉链接,网络爬虫,2021-12-16,美容,家居,清洁,音乐,食品,园艺 数据概述:...
    packageimg
  • Goodreads热门图书信息数据集

    2025年4月15日   

    Goodreads热门图书信息数据集 数据来源:互联网公开数据 标签:图书, Goodreads, 评价, 推荐系统, 作者, 评分, 书籍, 网络爬虫 数据概述: 本数据集通过网络爬虫技术,从 Goodreads...
    packageimg
  • 图书销售数据-图书信息与读者偏好分析数据集-2020年11月

    2025年4月15日   

    图书销售数据-图书信息与读者偏好分析数据集-2020年11月 数据来源:互联网公开数据 标签:图书,销售,元数据,读者偏好,价格,评分,书籍,网络爬虫 数据概述:...
    packageimg
  • 黑马漫画存档数据集

    2025年4月15日   

    黑马漫画存档数据集 数据来源:互联网公开数据 标签:漫画,黑马漫画,网络爬虫,存档,漫画信息,创作历史,出版年份 数据概述: 本数据集来源于对黑马漫画(DarkHorse Comics)的网络爬虫项目,收录了关于黑马漫画各漫画作品的基本信息。数据集包括漫画标题、创作历史、出版年份等关键要素,为研究黑马漫画的创作历程和出版情况提供了基础信息。...
    packageimg
  • 网络爬虫书籍数据集2023

    2025年4月15日   

    网络爬虫书籍数据集2023 数据来源:互联网公开数据 标签:书籍,网络爬虫,数据分析,分类,推荐系统,数据清洗,Python,bs4,requests 数据概述:...
    packageimg
  • Netflix剧集烂番茄评分与评论数据分析数据集

    2025年4月15日   

    Netflix剧集烂番茄评分与评论数据分析数据集 数据来源:互联网公开数据 标签:Netflix,剧集,烂番茄,评分,评论,网络爬虫,数据分析,媒体,娱乐 数据概述:...
    packageimg
  • 书籍销售与市场分析电商网站图书数据-2024年10月

    2025年4月15日   

    书籍销售与市场分析电商网站图书数据-2024年10月 数据来源:互联网公开数据 标签:书籍,电商,销售,市场分析,网络爬虫,价格,评分,库存,类别,教育 数据概述: 本数据集通过网络爬虫技术抓取了“Books to...
    packageimg
  • 多米尼加二手车交易价格与车辆信息数据集-Supercarros网站-2024年

    2025年4月15日   

    多米尼加二手车交易价格与车辆信息数据集-Supercarros网站-2024年 数据来源:互联网公开数据 标签:二手车,车辆信息,价格,多米尼加,汽车交易,网络爬虫,车辆评估,市场分析 数据概述:...
    packageimg
  • Goodreads必读书籍列表图书信息数据集

    2025年4月15日   

    Goodreads必读书籍列表图书信息数据集 数据来源:互联网公开数据 标签:Goodreads, 必读书籍, 图书信息, 书籍描述, 图书分类, 网络爬虫, 数据集 数据概述: 本数据集源自Goodreads网站上“每个人都应该至少读一次的书籍”列表。数据收集过程分为两个主要阶段,以确保全面且准确地获取所有相关信息。 数据收集步骤: 书籍URL抓取:...
    packageimg
  • 巴西电商平台商品信息抓取数据集

    2025年4月14日   

    巴西电商平台商品信息抓取数据集 数据来源:互联网公开数据 标签:电商,巴西,市场分析,商品信息,数据抓取,网络爬虫,Mercado Livre,Facebook,OLX 数据概述: 本数据集是通过网络爬虫技术,从巴西主要电商平台(Mercado...
    packageimg
  • 美国汽车市场数据集

    2025年4月14日   

    美国汽车市场数据集 数据来源:互联网公开数据 标签:汽车市场,美国,汽车价格,数据清洗,数据预处理,网络爬虫,Selenium,BeautifulSoup 数据概述:...
    packageimg
  • 技术数据集

    2025年4月14日   

    技术数据集 数据来源:互联网公开数据 标签:技术信息,数据集,CSV文件,TXT文件,技术历史,网络爬虫,数据获取 数据概述:...
    packageimg
  • 中文网站robots-txt数据集

    2025年4月14日   

    中文网站robots-txt数据集 数据来源:互联网公开数据 标签:中文网站,robots.txt,网络爬虫,网站抓取,网络数据,爬虫技术,网站规则 数据概述:...
    packageimg
  • Reddit和Imgur平台梗图元数据整合数据集-2018年

    2025年4月14日   

    Reddit和Imgur平台梗图元数据整合数据集-2018年 数据来源:互联网公开数据 标签:梗图,Reddit,Imgur,社交媒体,图像数据,浏览量,数据挖掘,网络爬虫,用户行为,教育研究 数据概述:...
    packageimg