-
网页新闻内容标签标注数据集-2023-alirezaataei
2025年6月1日 30 63 20
网页新闻内容标签标注数据集-2023-alirezaataei 数据来源:互联网公开数据 标签:网页抓取,HTML标签,新闻内容,机器学习,数据标注,结构化数据 数据概述:... -
Mango品牌商品信息及图片数据集-maparla
2025年5月31日 30 18 0
Mango品牌商品信息及图片数据集-maparla 数据来源:互联网公开数据 标签:Mango,商品信息,产品图片,电商数据,服装,时尚,零售,网页抓取 数据概述: 本数据集包含了从Mango官方网站抓取的产品信息,包含7000+张商品图片。... -
Metacritic电影评论数据集-2023-mechamod
2025年5月31日 30 183 113
Metacritic电影评论数据集-2023-mechamod 数据来源:互联网公开数据 标签:Metacritic,电影评论,网页抓取,数据分析,用户评价,电影分析,评分数据, BeautifulSoup 数据概述:... -
网站XML站点地图数据集
2025年5月31日 30 207 205
网站XML站点地图数据集 数据来源:互联网公开数据 标签:XML,站点地图,CSV格式,网络爬虫,数据提取,站点分析,网页抓取,SEO优化,数据集成 数据概述: 本数据集包含多个网站的XML站点地图,以CSV格式存储。数据集由advertools函数sitemap_to_df生成,支持通过sitemap... -
企业分类语料库-网站内容与行业标签数据集-charanpuvvala
2025年5月30日 30 16 6
企业分类语料库-网站内容与行业标签数据集-charanpuvvala 数据来源:互联网公开数据 标签:企业分类,行业标签,网站数据,文本挖掘,机器学习,自然语言处理,网页抓取,SEO 数据概述: 本数据集旨在提供一个用于企业分类任务的语料库,其中包含了预先分类的企业信息以及从其网站上抓取的数据。数据的主要组成部分包括: Category(类别):... -
网页抓取数据集CrawlData-fdfyaytkt
2025年5月30日 30 56 0
网页抓取数据集CrawlData-fdfyaytkt 数据来源:互联网公开数据 标签:网页抓取,数据集,文本分析,自然语言处理,网络数据,信息检索,数据挖掘,网络爬虫 数据概述: 该数据集包含了从互联网上抓取到的网页内容数据,涵盖了各种主题和来源。主要特征如下: 时间跨度: 数据记录的时间范围不定,取决于网页抓取的具体时间。 地理范围:... -
天文学与地质学维基百科文章数据集AstronomyandGeologyWikipediaArticles-abdelrahmanghunemiii
2025年5月29日 30 130 9
天文学与地质学维基百科文章数据集AstronomyandGeologyWikipediaArticles-abdelrahmanghunemiii 数据来源:互联网公开数据 标签:维基百科, 天文学, 地质学, 文本分析, 网页抓取, 知识图谱, 信息检索, 自然语言处理 数据概述:... -
个护产品电商数据分析数据集PersonalCareProductsE-commerceDataAnalysis-ginasantana
2025年5月16日 30 113 104
个护产品电商数据分析数据集PersonalCareProductsE-commerceDataAnalysis-ginasantana 数据来源:互联网公开数据 标签:电商数据, 产品信息, 价格分析, 图像识别, 市场调研, 网页抓取, 零售数据, 数据挖掘 数据概述:... -
图书信息网络爬取数据集BookInformationWebScrapingDataset-lavanyabisht
2025年5月11日 30 169 55
图书信息网络爬取数据集BookInformationWebScrapingDataset-lavanyabisht 数据来源:互联网公开数据 标签:图书, 价格, 爬虫, 零售, 数据分析, 网页抓取, 市场调研, 文本数据 数据概述:... -
足球运动员姓名与球员页面链接数据集FootballPlayerNamesandURLDataset-sangameshwar
2025年5月8日 30 101 54
足球运动员姓名与球员页面链接数据集FootballPlayerNamesandURLDataset-sangameshwar 数据来源:互联网公开数据 标签:足球, 运动员, 球员, 姓名, 链接, 数据集, 体育, 网页抓取 数据概述: 该数据集包含足球运动员的姓名及其对应的球员页面链接。主要特征如下:... -
图书信息价格与评价数据集BookInformationPriceandRatingDataset-naeemkhan12
2025年5月7日 30 8 3
图书信息价格与评价数据集BookInformationPriceandRatingDataset-naeemkhan12 数据来源:互联网公开数据 标签:图书, 零售, 价格, 评价, 文本分析, 市场调研, 销售数据, 网页抓取 数据概述:... -
网页HTML数据清洗预处理数据集WebpageHTMLDataPreprocessingDataset-muhamadrakanakmal
2025年4月29日 60 31 13
网页HTML数据清洗预处理数据集WebpageHTMLDataPreprocessingDataset-muhamadrakanakmal 数据来源:互联网公开数据 标签:HTML, 数据清洗, 文本分析, 网页抓取, 数据预处理, 自然语言处理, 网页结构, 数据集 数据概述:... -
网页HTML文本数据-泰坦尼克号数据集WebHTMLTextData-TitanicDataset-martinsegmj
2025年5月1日 30 160 50
网页HTML文本数据-泰坦尼克号数据集WebHTMLTextData-TitanicDataset-martinsegmj 数据来源:互联网公开数据 标签:HTML文本, 网页数据, 数据清洗, 泰坦尼克号, 文本分析, 数据挖掘, 网页抓取, 结构化数据 数据概述:... -
网站内容分类数据集WebsiteContentClassification-duccao2104
2025年5月1日 30 33 29
网站内容分类数据集WebsiteContentClassification-duccao2104 数据来源:互联网公开数据 标签:网站分类, 文本分析, 自然语言处理, 网页内容, 机器学习, 文本分类, 数据标注, 网页抓取 数据概述: 该数据集包含从互联网上抓取的网站内容,记录了网站的URL、清洗后的网页文本以及对应的分类标签。主要特征如下:... -
大麻产品信息网页抓取数据集CannabisProductInformationWebScrapingDataset-gauravgurjar
2025年4月30日 30 119 100
大麻产品信息网页抓取数据集CannabisProductInformationWebScrapingDataset-gauravgurjar 数据来源:互联网公开数据 标签:大麻, 产品信息, 网页抓取, 文本数据, 零售, 市场分析, 数据清洗, 市场调研 数据概述:... -
图书畅销榜单网页数据分析数据集BookBestsellersWebpageDataAnalysis-dejarayan
2025年4月29日 30 203 4
图书畅销榜单网页数据分析数据集BookBestsellersWebpageDataAnalysis-dejarayan 数据来源:互联网公开数据 标签:畅销书, 图书市场, 网页抓取, 数据清洗, 自然语言处理, 市场分析, 文本分析, 数据可视化 数据概述:... -
网页HTML数据清洗与分析数据集WebpageHTMLDataCleaningandAnalysis-abbat108
2025年4月29日 30 178 18
网页HTML数据清洗与分析数据集WebpageHTMLDataCleaningandAnalysis-abbat108 数据来源:互联网公开数据 标签:HTML, 网页数据, 数据清洗, 文本分析, 网页抓取, 数据预处理, 爬虫, 信息提取 数据概述:... -
网页标题更新对比数据集WebpageTitleUpdateComparison-maiiaguseva
2025年4月29日 30 134 17
网页标题更新对比数据集WebpageTitleUpdateComparison-maiiaguseva 数据来源:互联网公开数据 标签:网页抓取, 文本分析, 标题变更, 数据清洗, 时间序列, 舆情分析, 网页监测, 信息追踪 数据概述:... -
新闻网站URL抓取数据集NewsWebsiteURLScrapingDataset-usmanahmad12
2025年4月29日 30 80 6
新闻网站URL抓取数据集NewsWebsiteURLScrapingDataset-usmanahmad12 数据来源:互联网公开数据 标签:新闻, URL, 网页抓取, 数据采集, 文本分析, 信息检索, 数据挖掘, 互联网 数据概述: 该数据集包含从新闻网站抓取的URL链接,旨在为新闻内容分析和信息检索提供基础数据。主要特征如下:... -
迪卡侬官网商品信息数据集DecathlonWebScrapedDataset-nikhilchadha1537
2025年4月26日 30 207 155
迪卡侬官网商品信息数据集DecathlonWebScrapedDataset-nikhilchadha1537 数据来源:互联网公开数据 标签:电子商务,商品信息,数据集,网页抓取,零售分析,数据挖掘,消费者行为,机器学习 数据概述: 该数据集包含来自迪卡侬(Decathlon)官方网站的商品信息,记录了各类商品的详细数据。主要特征如下:...