找到7个数据集

格式: csv 标签: 数据清洗实践

过滤结果
  • Nazario Phishing Email Corpus

    2025年8月20日 35 6 2

    真实钓鱼邮件与正常企业邮件
    packageimg
  • 2025 年全球产品库存数据集(包含库存、价格和规格的详细产品目录)

    2025年3月6日 80 194 35

    该数据集提供了产品库存的详细快照,非常适合物流优化、电子商务分析或供应链研究。它包括产品名称、类别、价格、库存数量等关键详细信息,这些信息来自假设的全球供应商数据库。 主要特点:14 栏涵盖产品规格、定价、库存和标签。 样本数据包括家用电器等多种类别。 非常适合数据清理实践、可视化或预测建模(例如库存消耗)。 潜在用例: 根据库存和到期日优化运输物流。...
    packageimg
  • 建立团队的分析方法:原神角色列表 5.2 版

    2025年2月14日 200 14 12

    该数据集包含《原神》5.2 版以来的所有角色 创建此数据集是为了让像我这样的有抱负的数据分析师能够以独特而有趣的方式练习处理数据。下载数据集的用户可以练习使用数据可视化,并在玩《原神》时根据自己的需求快速访问角色信息。
    packageimg
  • NIH 平衡胸部 X 光检查

    2025年2月13日 220 43 42

    将高度不平衡的数据集转换为具有 1024x1024 图像的平衡数据集 关于此文件 标签的独热编码格式 小路 肺不张 心脏扩大 合并 浮肿 积液 气肿 纤维化 疝 浸润 大量的 未发现 结核 胸膜增厚 肺炎 气胸
    packageimg
  • 用于学习的合成数据集:基本回归学习数据集

    2025年2月13日 200 156 81

    提出了 4 个数据框来解决回归问题。数据框变量的描述在相应的文档 .
    packageimg
  • JUIndoorLoc:使用 WiFi 进行室内定位

    2025年2月12日 200 6 3

    使用 WiFi 信号强度预测室内区域用户的位置 用于室内定位的WiFi 指纹数据集JUIndoorLoc包含从多个预定义室内位置的多个 WiFi 接入点 (AP) 收集的接收信号强度数据 (RSS)。数据集中的每个条目都对应于由特定坐标作为标签标识的唯一位置,并包含来自附近 AP 的 RSS...
    packageimg
  • 欺诈检测数据集

    2024年12月24日 30 81 27

    该数据集使用 Faker 库生成,用于模拟交易数据。它包含多个列,代表用户和交易信息,包括用于检测欺诈活动的特征。数据包括分类、数字和日期时间值的混合,需要对其进行处理才能进行机器学习。
    packageimg