找到8个数据集

标签: 网站分类

过滤结果
  • 网站内容分类数据集WebsiteContentClassification-duccao2104

    2025年5月1日 30 126 124

    网站内容分类数据集WebsiteContentClassification-duccao2104 数据来源:互联网公开数据 标签:网站分类, 文本分析, 自然语言处理, 网页内容, 机器学习, 文本分类, 数据标注, 网页抓取 数据概述: 该数据集包含从互联网上抓取的网站内容,记录了网站的URL、清洗后的网页文本以及对应的分类标签。主要特征如下:...
    packageimg
  • 网站分类游戏信息数据集WebsiteClassificationGamingInformationDataset-vaibhavdwivedi

    2025年5月1日 30 38 12

    网站分类游戏信息数据集WebsiteClassificationGamingInformationDataset-vaibhavdwivedi 数据来源:互联网公开数据 标签:网站分类, 游戏, 信息提取, 自然语言处理, 文本挖掘, 机器学习, 数据分析, 游戏网站 数据概述:...
    packageimg
  • 恶意与良性网站数据集MaliciousandBenignWebsitesDataset-deepsworld

    2025年4月23日 30 196 182

    恶意与良性网站数据集MaliciousandBenignWebsitesDataset-deepsworld 数据来源:互联网公开数据 标签:网络安全,网站分类,数据集,机器学习,数据挖掘,风险评估,网络分析,信息安全 数据概述: 该数据集包含来自互联网的安全分析数据,记录了网站的安全状态及相关特征。主要特征如下:...
    packageimg
  • 网络钓鱼网站分类数据集PhishingWebsiteClassifierDataset-govindkv

    2025年4月22日 30 42 3

    网络钓鱼网站分类数据集PhishingWebsiteClassifierDataset-govindkv 数据来源:互联网公开数据 标签:网络安全,数据集,机器学习,网站分类,风险评估,网络钓鱼,数据分析,信息安全管理 数据概述: 该数据集包含来自公开来源的网络钓鱼网站数据,记录了用于识别和分类钓鱼网站的特征信息。主要特征如下:...
    packageimg
  • 网站内容IAB分类数据集-payne18

    2025年4月22日 30 60 31

    网站内容IAB分类数据集-payne18 数据来源:互联网公开数据 标签:网站分类,IAB,广告,内容分析,机器学习,文本分类,网站,分类 数据概述: 本数据集包含了网站信息,并按照IAB标准(Interactive Advertising...
    packageimg
  • 谷歌主题与全球百万热门网站关联数据集

    2025年4月17日 30 26 1

    谷歌主题与全球百万热门网站关联数据集 数据来源:互联网公开数据 标签:谷歌主题,网站分类,域名,热门网站,数据分析,互联网,主题建模 数据概述: 本数据集整合了全球最受欢迎的100万个域名,并与谷歌主题进行了关联。域名数据来源于http://s3-us-west-1.amazonaws.com/umbrella-...
    packageimg
  • 博客识别数据集

    2025年4月15日 30 156 116

    博客识别数据集 数据来源:互联网公开数据 标签:博客识别,网站分类,特征提取,机器学习,网络安全,数据科学 数据概述: 本数据集包含从网站URL中识别页面是否为博客的信息。数据集中的大多数特征来自于文献[1],包含了用于判断页面性质的关键指标。尽管文中部分特征尚未包含在本数据集中,但相关信息将尽快补充。 数据用途概述:...
    packageimg
  • 带标签网站文本内容数据集

    2025年4月15日 30 111 60

    带标签网站文本内容数据集 数据来源:互联网公开数据 标签:网站文本,标签数据,内容分析,自然语言处理,机器学习,分类算法,网站分类 数据概述: 本数据集包含13,500个网站的URL及其对应的文本内容。数据集中共有9个不同的类别,涵盖了多种类型的网站。网站的文本内容未经过预处理,使用者可以根据需要自行进行预处理。 数据用途概述:...
    packageimg