-
Metacritic电影评论数据集-2023-mechamod
2025年5月31日 30 8 4
Metacritic电影评论数据集-2023-mechamod 数据来源:互联网公开数据 标签:Metacritic,电影评论,网页抓取,数据分析,用户评价,电影分析,评分数据, BeautifulSoup 数据概述:... -
网站XML站点地图数据集
2025年5月31日 30 160 155
网站XML站点地图数据集 数据来源:互联网公开数据 标签:XML,站点地图,CSV格式,网络爬虫,数据提取,站点分析,网页抓取,SEO优化,数据集成 数据概述: 本数据集包含多个网站的XML站点地图,以CSV格式存储。数据集由advertools函数sitemap_to_df生成,支持通过sitemap... -
企业分类语料库-网站内容与行业标签数据集-charanpuvvala
2025年5月30日 30 197 132
企业分类语料库-网站内容与行业标签数据集-charanpuvvala 数据来源:互联网公开数据 标签:企业分类,行业标签,网站数据,文本挖掘,机器学习,自然语言处理,网页抓取,SEO 数据概述: 本数据集旨在提供一个用于企业分类任务的语料库,其中包含了预先分类的企业信息以及从其网站上抓取的数据。数据的主要组成部分包括: Category(类别):... -
网页抓取数据集CrawlData-fdfyaytkt
2025年5月30日 30 193 102
网页抓取数据集CrawlData-fdfyaytkt 数据来源:互联网公开数据 标签:网页抓取,数据集,文本分析,自然语言处理,网络数据,信息检索,数据挖掘,网络爬虫 数据概述: 该数据集包含了从互联网上抓取到的网页内容数据,涵盖了各种主题和来源。主要特征如下: 时间跨度: 数据记录的时间范围不定,取决于网页抓取的具体时间。 地理范围:... -
天文学与地质学维基百科文章数据集AstronomyandGeologyWikipediaArticles-abdelrahmanghunemiii
2025年5月29日 30 6 1
天文学与地质学维基百科文章数据集AstronomyandGeologyWikipediaArticles-abdelrahmanghunemiii 数据来源:互联网公开数据 标签:维基百科, 天文学, 地质学, 文本分析, 网页抓取, 知识图谱, 信息检索, 自然语言处理 数据概述:... -
个护产品电商数据分析数据集PersonalCareProductsE-commerceDataAnalysis-ginasantana
2025年5月16日 30 28 0
个护产品电商数据分析数据集PersonalCareProductsE-commerceDataAnalysis-ginasantana 数据来源:互联网公开数据 标签:电商数据, 产品信息, 价格分析, 图像识别, 市场调研, 网页抓取, 零售数据, 数据挖掘 数据概述:... -
图书信息网络爬取数据集BookInformationWebScrapingDataset-lavanyabisht
2025年5月11日 30 18 16
图书信息网络爬取数据集BookInformationWebScrapingDataset-lavanyabisht 数据来源:互联网公开数据 标签:图书, 价格, 爬虫, 零售, 数据分析, 网页抓取, 市场调研, 文本数据 数据概述:... -
足球运动员姓名与球员页面链接数据集FootballPlayerNamesandURLDataset-sangameshwar
2025年5月8日 30 71 50
足球运动员姓名与球员页面链接数据集FootballPlayerNamesandURLDataset-sangameshwar 数据来源:互联网公开数据 标签:足球, 运动员, 球员, 姓名, 链接, 数据集, 体育, 网页抓取 数据概述: 该数据集包含足球运动员的姓名及其对应的球员页面链接。主要特征如下:... -
图书信息价格与评价数据集BookInformationPriceandRatingDataset-naeemkhan12
2025年5月7日 30 172 96
图书信息价格与评价数据集BookInformationPriceandRatingDataset-naeemkhan12 数据来源:互联网公开数据 标签:图书, 零售, 价格, 评价, 文本分析, 市场调研, 销售数据, 网页抓取 数据概述:... -
网页HTML数据清洗预处理数据集WebpageHTMLDataPreprocessingDataset-muhamadrakanakmal
2025年4月29日 60 201 169
网页HTML数据清洗预处理数据集WebpageHTMLDataPreprocessingDataset-muhamadrakanakmal 数据来源:互联网公开数据 标签:HTML, 数据清洗, 文本分析, 网页抓取, 数据预处理, 自然语言处理, 网页结构, 数据集 数据概述:... -
网页HTML文本数据-泰坦尼克号数据集WebHTMLTextData-TitanicDataset-martinsegmj
2025年5月1日 30 112 61
网页HTML文本数据-泰坦尼克号数据集WebHTMLTextData-TitanicDataset-martinsegmj 数据来源:互联网公开数据 标签:HTML文本, 网页数据, 数据清洗, 泰坦尼克号, 文本分析, 数据挖掘, 网页抓取, 结构化数据 数据概述:... -
网站内容分类数据集WebsiteContentClassification-duccao2104
2025年5月1日 30 43 9
网站内容分类数据集WebsiteContentClassification-duccao2104 数据来源:互联网公开数据 标签:网站分类, 文本分析, 自然语言处理, 网页内容, 机器学习, 文本分类, 数据标注, 网页抓取 数据概述: 该数据集包含从互联网上抓取的网站内容,记录了网站的URL、清洗后的网页文本以及对应的分类标签。主要特征如下:... -
大麻产品信息网页抓取数据集CannabisProductInformationWebScrapingDataset-gauravgurjar
2025年4月30日 30 116 65
大麻产品信息网页抓取数据集CannabisProductInformationWebScrapingDataset-gauravgurjar 数据来源:互联网公开数据 标签:大麻, 产品信息, 网页抓取, 文本数据, 零售, 市场分析, 数据清洗, 市场调研 数据概述:... -
图书畅销榜单网页数据分析数据集BookBestsellersWebpageDataAnalysis-dejarayan
2025年4月29日 30 168 147
图书畅销榜单网页数据分析数据集BookBestsellersWebpageDataAnalysis-dejarayan 数据来源:互联网公开数据 标签:畅销书, 图书市场, 网页抓取, 数据清洗, 自然语言处理, 市场分析, 文本分析, 数据可视化 数据概述:... -
网页HTML数据清洗与分析数据集WebpageHTMLDataCleaningandAnalysis-abbat108
2025年4月29日 30 188 15
网页HTML数据清洗与分析数据集WebpageHTMLDataCleaningandAnalysis-abbat108 数据来源:互联网公开数据 标签:HTML, 网页数据, 数据清洗, 文本分析, 网页抓取, 数据预处理, 爬虫, 信息提取 数据概述:... -
网页标题更新对比数据集WebpageTitleUpdateComparison-maiiaguseva
2025年4月29日 30 7 0
网页标题更新对比数据集WebpageTitleUpdateComparison-maiiaguseva 数据来源:互联网公开数据 标签:网页抓取, 文本分析, 标题变更, 数据清洗, 时间序列, 舆情分析, 网页监测, 信息追踪 数据概述:... -
新闻网站URL抓取数据集NewsWebsiteURLScrapingDataset-usmanahmad12
2025年4月29日 30 40 29
新闻网站URL抓取数据集NewsWebsiteURLScrapingDataset-usmanahmad12 数据来源:互联网公开数据 标签:新闻, URL, 网页抓取, 数据采集, 文本分析, 信息检索, 数据挖掘, 互联网 数据概述: 该数据集包含从新闻网站抓取的URL链接,旨在为新闻内容分析和信息检索提供基础数据。主要特征如下:... -
迪卡侬官网商品信息数据集DecathlonWebScrapedDataset-nikhilchadha1537
2025年4月26日 30 126 124
迪卡侬官网商品信息数据集DecathlonWebScrapedDataset-nikhilchadha1537 数据来源:互联网公开数据 标签:电子商务,商品信息,数据集,网页抓取,零售分析,数据挖掘,消费者行为,机器学习 数据概述: 该数据集包含来自迪卡侬(Decathlon)官方网站的商品信息,记录了各类商品的详细数据。主要特征如下:... -
Booking-com酒店网址数据集Booking-comHotelURLsDataset-suhruthyambakam
2025年4月25日 30 11 1
Booking-com酒店网址数据集Booking-comHotelURLsDataset-suhruthyambakam 数据来源:互联网公开数据 标签:酒店,旅游,数据集,网页抓取,数据分析,市场调研,商业智能,地理信息 数据概述: 该数据集包含了从Booking.com抓取的酒店网址信息,旨在为酒店行业,旅游研究等提供数据支持。主要特征如下:... -
苹果iPhone在eBay平台上的日度网页抓取数据集2021-2022-bme3412
2025年4月24日 30 115 59
苹果iPhone在eBay平台上的日度网页抓取数据集2021-2022-bme3412 数据来源:互联网公开数据 标签:电子商务,电子产品,数据集,网页抓取,价格分析,市场趋势,机器学习,销售预测 数据概述: 该数据集包含来自eBay平台的苹果iPhone产品销售数据,记录了2021年至2022年期间每日的iPhone产品信息及交易数据。主要特征如下:...