-
垃圾短信垃圾邮件收集数据集
2024年11月9日 30 20 3
从 Grumbletext 网站手动提取了 425 条垃圾短信。这是一个英国论坛,手机用户在此公开声明垃圾短信,但大多数用户并未报告收到的垃圾短信。 NUS SMS Corpus (NSC) 的 3,375 条随机选择的 SMS 短信子集,该数据集包含约 10,000... -
土壤测量检测数据集
2024年11月9日 30 30 5
此数据集中的每一行代表特定田地土壤的各种测量值。根据这些测量值,列中指定的作物"crop"是该田地的最佳选择。这些数据可用于预测农民田地的最佳作物。 -
可穿戴传感器动作分析数据集
2024年11月9日 30 26 10
该数据集旨在使用从可穿戴传感器收集的数据,在人机交互 (HCI) 环境中进行动作分类,并与动画设计的仿生视觉系统相结合。该数据集是作为一项研究的一部分收集的,该研究旨在改善实时人体动作识别,以增强虚拟现实 (VR) 和增强现实 (AR) 环境中的沉浸式体验。参与者:数据来自 30 名参与者(15 名男性和 15... -
印度各城市犯罪数据
2024年11月9日 30 14 2
该数据集捕捉了 2020 年至 2024 年印度多个城市犯罪活动的全面快照。它包括有关犯罪类型、发生日期和时间、使用的武器、受害者人口统计数据以及警察部署级别的详细信息。该数据集的犯罪范围从身份盗窃到凶杀,为研究人员、政策制定者和执法机构提供了宝贵的见解,旨在了解犯罪模式并改善公共安全。该数据还包括有关案件是否已结案的信息,从而清楚地了解各个城市的犯罪解决率 -
医学和健康领域支出数据集
2024年12月19日 30 22 6
自 1996 年以来,各国在研究与开发 (R&D) 上的支出,指标包括资金来源、研发活动类型、研发领域(医学和健康科学)。 数据 数据来自联合国教科文组织统计研究所 http://data.uis.unesco.org... -
冒犯性语言文本数据集(英文)
2024年11月9日 30 30 3
数据以CSV格式和pickled pandas数据框(Python 2.7)存储。 count = 编码每条推文的CrowdFlower用户数量(最小值为3,有时当CF判断推文不可靠时,会有更多用户编码一条推文)。 hate_speech = 判断推文为仇恨言论的CF用户数量。 offensive_language =... -
全球顶级域名授权数据集
2024年12月19日 30 20 7
该数据集包含全球范围内各国家、地区及部分组织的 顶级域名(Top-Level Domain,简称 TLD),这些域名通常由 ICANN(互联网名称与数字地址分配机构) 授权并管理。数据包括国家/地区代码、对应的国家顶级域名(ccTLD)、以及通用顶级域名(gTLD)。 -
全球货币代码数据集
2024年12月19日 30 20 1
ISO 4217 货币及其三位代码列表 数据来源 该数据基于ISO 4217标准,汇总了以下两个表格中的信息: 表A.1 - 现行货币与资金代码列表 表A.3 - 历史货币与资金代码列表 数据描述 数据包含全球现行及历史货币的三位字母代码。 该列表将上述两个ISO标准表格的数据整合为一个统一的数据包,存储于data/codes.csv文件中。 数据获取... -
-
全球温度变化数据集
2024年12月19日 60 18 6
数据来源 该数据来自以下两个全球气温分析项目: GISS地表气温分析(GISTEMP):由美国宇航局(NASA)戈达德空间研究所(GISS)提供。 全球气候概览(GCAG):由美国国家海洋和大气管理局(NOAA)提供。 数据描述 提供了以下两个数据集: 全球月度平均气温异常(单位:摄氏度) 全球年度平均气温异常(单位:摄氏度) 时间范围 GISTEMP... -
全球海平面上升数据集
2024年12月19日 150 14 10
我们根据 1993 年至 2009 年的卫星高度计数据以及 1880 年至 2009 年的沿海和岛屿海平面测量数据估算了全球平均海平面的上升情况。对于 1993 年至 2009 年,在对冰川均衡调整进行校正后,卫星数据估计的上升率为每年 3.2 ± 0.4 毫米,现场数据估计的上升率为每年 2.8 ± 0.8 毫米。1880 年至 2009... -
全球二氧化碳浓度
2024年12月19日 180 20 6
CO2 PPM - 大气二氧化碳趋势。数据来源于美国政府地球系统研究实验室全球监测部。提供两个主要系列:莫纳罗亚系列(自 1958 年以来最长的连续系列)和全球平均系列(海洋表面站点的全球平均值)。 数据以干空气摩尔分数的形式报告,其定义为去除水蒸气后二氧化碳分子数除以空气中所有分子(包括二氧化碳本身)的数量。摩尔分数以百万分率 (ppm)... -
-
供应链成本优化数据集
2024年11月9日 150 30 2
该数据集专为供应链优化问题而设计,其目标是在满足客户需求的同时最小化总运输和库存成本。该数据集包含有关多个供应商、客户、运输成本和其他物流相关参数的信息。 供应商:此数据集包含五个供应商(供应商 1 至供应商 5)。每个供应商都有特定的供应能力和相关成本。客户:六个客户(客户 1 至客户 6)有特定需求要求,需要供应商满足。... -
伦敦空气质量数据集
2024年12月19日 60 30 2
该数据集是从伦敦数据网站抓取的。 数据显示路边和背景中一氧化氮、二氧化氮、氮氧化物、臭氧、颗粒物(PM10 和 PM2.5)和二氧化硫的平均读数。以每立方米空气微克 (ug/m3) 为单位。电子表格显示每个读数属于哪个指数水平,并包含按月按一天中不同时间显示污染物水平的图表。 -
人体原发性肿瘤的数据集
2024年12月19日 30 12 2
这是关于人体原发性肿瘤的数据集。原发性肿瘤的位置是指肿瘤在体内首次出现并从那里开始转移到身体其他部位的位置。 该原发性肿瘤区域来自南斯拉夫卢布尔雅那大学医学中心肿瘤研究所。 -
二手车价格预测数据集
2024年11月10日 60 23 9
了解一辆车的具体制造年份可以帮助评估其技术先进程度及潜在的折旧情况;检查车辆的行驶里程是判断其使用状况和未来维护成本的重要依据;了解车辆是否经历过事故及其修复情况对于评估车况则直接影响到车辆的安全性和可靠性。 本数据集来源于汽车市场网站... -
乳腺癌病例数据集
2024年12月19日 30 24 8
乳腺癌数据集说明 原始数据提供者: Matjaz Zwitter 和 Milan Soklic(医生) 机构:南斯拉夫卢布尔雅那大学医学中心肿瘤研究所 数据文件 文件名:data/breast-cancer.csv 数据描述 样本数量:286个病例 属性数量:10个属性 缺失值:存在缺失值 分类标签(目标变量) 类别分布(Class... -
世界主要城市列表数据集
2024年12月19日 30 19 1
该数据来自于GeoNames,这是一个包含全球地名的详尽数据库。 数据描述 此数据包仅包含人口超过15,000的城市。每个城市都与其所属国家和次级行政区相关联,以减少名称歧义。次级行政区可以是一个州的名称(例如英国或美国的州),也可以是主要的行政区域(例如法国的“地区”)。有关次级行政区的详细信息,请参阅GeoNames网站上的admin1字段。... -
Web 浏览器使用情况统计数据
2024年12月19日 60 13 1
浏览器使用统计数据集说明 数据来源 主要数据来源为 W3Schools 浏览器统计,该数据来自W3Schools服务器的日志文件。 数据内容 data.csv:包含现行与已停止支持的浏览器的使用统计数据。 data-extant.csv:仅包括当前仍在使用的浏览器的统计数据。 应用场景 网页开发与优化:分析不同浏览器的市场份额,优化网站兼容性。...