-
电子商务消费者趋势和偏好
2025年2月17日 300 23 7
该数据集全面洞察了消费者的在线购物行为和偏好。它基于调查回复,重点关注购物频率、首选付款方式、吸引力因素、安全问题和经常购买的产品类别等关键方面。该数据集为有兴趣了解在线消费者趋势和改进电子商务策略的企业、营销人员和研究人员提供了宝贵的信息。 主要特点: 人口统计信息:受访者的性别,帮助分析性别群体的偏好。 购物频率:受访者进行网上购物活动的频率。... -
甲状腺癌风险数据集
2025年2月24日 50 14 6
包含 212,691 条记录,具有 23 个属性 该数据集包含 13 个临床病理特征,旨在预测分化良好的甲状腺癌的复发。该数据集的收集时间为 15 年,对每位患者进行了至少 10 年的随访。 -
用于分析和检测钓鱼网站的有用数据集
2025年3月6日 100 18 6
该数据集旨在帮助分析和检测钓鱼网站。它包含各种特征,可帮助根据结构、安全和行为属性区分合法网站和钓鱼网站。 总列数: 31(30 个特征 + 1 个目标) 目标变量:( Result表明网站是钓鱼网站还是合法网站) 功能描述 基于 URL 的功能 Prefix_Suffix– 检查 URL 是否包含连字符 ( -),该符号常用于网络钓鱼域。... -
生育数据集:精子浓度及其影响因素
2025年2月12日 200 18 3
100名志愿者提供精液样本,按照WHO 2010标准进行分析。精子浓度与社会人口统计数据、环境因素、健康状况和生活习惯有关 10 列分隔为: 9 个特征列 1 个输出列(诊断) 数据集特征: 多变量 实例数: 100 属性数量: 10 相关任务:分类、回归 属性信息: 进行分析的季节 冬天 春天 夏天 春天 分析时的年龄 18-36... -
犯罪率与社会经济因素
2025年2月24日 40 20 2
该数据集探讨了1,000 个地区的犯罪率与各种社会经济因素(如教育水平、就业率、中位数收入、贫困率和人口密度)之间的关系。它专为对研究犯罪模式及其潜在社会经济影响感兴趣的研究人员、数据分析师和机器学习从业者而设计。 数据集特征 该数据集包含1,000 行和7 列,每列代表一个地区及其社会经济属性:... -
物联网网络流量数据集
2025年3月3日 60 27 5
此物联网网络流量数据集旨在支持智能网络管理模型的研究和开发,特别侧重于物联网无线传感器网络中的资源分配。它反映了现实世界的网络行为和设备活动,非常适合优化带宽分配并确保大规模物联网环境中的高效、可扩展通信。 列解释: packet_size(字节)— 数据包大小 transmission_time(毫秒)— 数据包传输所需时间... -
混凝土强度数据集
2025年2月14日 210 10 9
混凝土抗压强度数据集: 该数据集包含混凝土抗压强度的数据,这是建筑施工中的关键因素。它包括影响混凝土整体强度的各种输入参数,例如水泥含量、水比和养护年龄等。该数据集非常适合回归分析和机器学习模型开发,可根据输入变量预测混凝土强度。 功能描述: 水泥成分: 描述:此特征代表混凝土混合物中使用的水泥量。... -
浦那空气质量指数
2025年2月12日 115 17 9
该数据集包含印度浦那一段较长时期的空气质量观测记录。其中包括 SO2、NOx 和 RSPM 等主要污染物的浓度以及相应的空气质量指数 (AQI)。这些数据可用于环境分析、趋势预测以及开发机器学习模型来监测和预测空气质量。 列: 日期:观察日期(格式DD-MM-YYYY:)。 SO2:二氧化硫浓度(µg/m³)。注:缺少一个值。... -
-
欺诈检测数据集
2024年12月24日 30 23 10
该数据集使用 Faker 库生成,用于模拟交易数据。它包含多个列,代表用户和交易信息,包括用于检测欺诈活动的特征。数据包括分类、数字和日期时间值的混合,需要对其进行处理才能进行机器学习。 -
根据社会经济和健康因素提供的各国国家信息
2025年2月18日 200 26 5
根据社会经济和健康因素,了解世界各国的信息,以确定一个国家的总体发展情况,从而协助 HELP International 以及其他非政府组织战略性地、有效地使用其资金。 列包含: 国家名称 child_mort 出口 健康 进口 收入 通货膨胀 life_expec 总费用 国内生产总值 -
皮马印第安人糖尿病数据集:根据不同的特征预测患糖尿病的可能性
2025年2月14日 200 17 7
最初来自美国国家糖尿病、消化和肾脏疾病研究所。该数据集的目标是根据数据集中包含的多个特征准确预测患者是否患有糖尿病。使用该数据集通过随机森林分类器获得了 92.86% 的准确度指标得分。甚至使用该训练模型开发了一个 Web 服务糖尿病预测系统。您可以探索探索性数据分析笔记本以更好地理解数据。 属性 正常值 范围 葡萄糖:葡萄糖 (< 140) =... -
材料寿命预测数据集
2025年2月13日 100 12 7
该数据集包含用于预测工业部件所用材料寿命(以小时为单位)的模拟数据。它包括与材料成分、制造工艺和结构缺陷相关的各种特征。该数据集非常适合探索回归技术、特征工程和材料科学应用。 列 PredictedHours:代表预测寿命(以小时为单位)的目标变量。 ComponentType:组件的类型(例如喷嘴、叶片、块体)。... -
智能电网实时负荷监测数据集
2025年2月24日 50 16 5
智能电网实时负荷监测数据集是一个时间序列数据集,专为智能电网中的能源管理、负荷预测和故障检测而设计。它包括关键电气参数、可再生能源、环境因素和异常指标,使其适用于能源优化中的机器学习和深度学习应用。 主要特点 50,000+ 条记录,每隔 15 分钟进行一次实时分析。 智能电网参数:电压、电流、功耗和无功功率。 可再生能源:太阳能和风能贡献。... -
新加坡美食街统计
2025年3月25日 30 10 5
数据内容:该数据集中包含了新加坡各地美食街和小贩中心的重要数据元素,包括街市或小贩中心名称、地址、中心类型、所有者、摊位数量、熟食档数目以及街市农产品摊档数目。数据元素中有部分需要通过发短信获取具体信息。 数据来源:互联网公开数据... -
新加坡火车站名称统计
2025年2月20日 30 20 8
标题:揭开新加坡火车站名称的神秘面纱 数据内容:数据集包含新加坡火车站的中文名称,对应多个捷运站及专线简体中文名称。列出了车站代码、各站的中文名称(包括台湾繁体和大陆简体)、所在的捷运专线及对应的线路名称。此数据集中的数据旨在详细统计并对比不同火车站在不同版本中文中的译名区别。 数据来源:互联网公开数据... -
新加坡按组件划分的年度电费低压电费统计
2025年2月9日 30 29 9
标题:新加坡年度电费分析:揭示低压电费的波动秘密 数据内容:该数据集涵盖了2008年1月至2021年3月间,新加坡低压电费的详细组成部分。数据元素包括: - 年份(YYYY):记录数据的具体年份。 - 能源成本:以数值形式提供,用于显示各年的能源费用。 - 电网费用:展示电力传输和分配的费用。 - 市场支持服务费:描述支持市场服务的费用。 -... -
新加坡按用户类型划分的并网太阳能光伏装置数量统计
2025年1月8日 30 29 6
标题:探索新加坡太阳能光伏装置的用户类型发展 数据内容:该数据集详细列出了从2008年1月至2021年3月,不同用户类型的并网太阳能光伏装置数量。数据按照年份划分,具体分类包括住宅用户和非住宅用户,后者进一步分为公共服务机构、城镇议会和基层单位、以及私营机构。数据还包括2010年及之后的一些年度数据修订,以纳入已停用和重新分类的装置信息。...