-
恶意软件分析数据集
2024年11月9日 60 115 54
数据集研究内容是使用深度学习进行恶意软件检测和分类。它包含从 Cuckoo Sandbox 报告的“pe_imports”元素中提取的静态分析数据(前 1000 个导入函数)。PE 恶意软件示例是从virusshare.com 下载的。PE 好软件示例是从 portableapps.com 和 Windows 7 x86 目录下载的。
-
舞蹈音乐数据集
2024年11月9日 60 2 0
该数据集专为音乐信息检索 (MIR) 和人工智能 (AI) 技术的研究而设计,尤其侧重于将音乐曲目与适当的舞蹈风格进行匹配。该数据集包含合成音乐特征和舞蹈风格标签,适合开发为各种舞蹈形式提供音乐选择和搭配建议的智能系统。
-
-
-
英国犯罪数据集
2024年12月19日 30 119 64
英国犯罪数据集说明 数据来源 主要来源:英国政府犯罪数据网站 police.uk/data 附加资源: 警力信息(Forces Info):forces.csv (Google 文档版本) 人口数据(Population Data):英国内政部(Home Office)人口估算表 应用场景 公共安全与政策分析:用于分析犯罪趋势、支持决策与政策制定。...
-
乳腺癌病例数据集
2024年12月19日 30 36 13
乳腺癌数据集说明 原始数据提供者: Matjaz Zwitter 和 Milan Soklic(医生) 机构:南斯拉夫卢布尔雅那大学医学中心肿瘤研究所 数据文件 文件名:data/breast-cancer.csv 数据描述 样本数量:286个病例 属性数量:10个属性 缺失值:存在缺失值 分类标签(目标变量) 类别分布(Class...
-
皮肤癌病例数据集
2024年12月19日 30 12 3
皮肤病数据集说明 分类标签(目标变量) Class(分类):代表诊断的皮肤病类型 银屑病(Psoriasis) 脂溢性皮炎(Seboreic Dermatitis) 扁平苔藓(Lichen Planus) 玫瑰糠疹(Pityriasis Rosea) 慢性皮炎(Cronic Dermatitis) 毛发红糠疹(Pityriasis Rubra...
-
Web 浏览器使用情况统计数据
2024年12月19日 60 16 4
浏览器使用统计数据集说明 数据来源 主要数据来源为 W3Schools 浏览器统计,该数据来自W3Schools服务器的日志文件。 数据内容 data.csv:包含现行与已停止支持的浏览器的使用统计数据。 data-extant.csv:仅包括当前仍在使用的浏览器的统计数据。 应用场景 网页开发与优化:分析不同浏览器的市场份额,优化网站兼容性。...
-
全球货币代码数据集
2024年12月19日 30 153 87
ISO 4217 货币及其三位代码列表 数据来源 该数据基于ISO 4217标准,汇总了以下两个表格中的信息: 表A.1 - 现行货币与资金代码列表 表A.3 - 历史货币与资金代码列表 数据描述 数据包含全球现行及历史货币的三位字母代码。 该列表将上述两个ISO标准表格的数据整合为一个统一的数据包,存储于data/codes.csv文件中。 数据获取...
-
世界主要城市列表数据集
2024年12月19日 30 125 75
该数据来自于GeoNames,这是一个包含全球地名的详尽数据库。 数据描述 此数据包仅包含人口超过15,000的城市。每个城市都与其所属国家和次级行政区相关联,以减少名称歧义。次级行政区可以是一个州的名称(例如英国或美国的州),也可以是主要的行政区域(例如法国的“地区”)。有关次级行政区的详细信息,请参阅GeoNames网站上的admin1字段。...
-
全球顶级域名授权数据集
2024年12月19日 30 89 60
该数据集包含全球范围内各国家、地区及部分组织的 顶级域名(Top-Level Domain,简称 TLD),这些域名通常由 ICANN(互联网名称与数字地址分配机构) 授权并管理。数据包括国家/地区代码、对应的国家顶级域名(ccTLD)、以及通用顶级域名(gTLD)。
-
联合国贸易和运输地点代码
2024年12月18日 180 128 81
联合国贸易和运输地点代码(UN/LOCODE) 是由联合国欧洲经济委员会(UNECE)维护和发布的一套全球标准化的地点代码,用于标识国际贸易和运输中的港口、机场、铁路站、公路终点、边境站以及其他相关地点。此数据集在全球物流、贸易、运输、跨境电商和地理信息系统(GIS)中广泛应用。
-
可穿戴传感器动作分析数据集
2024年11月9日 30 59 2
该数据集旨在使用从可穿戴传感器收集的数据,在人机交互 (HCI) 环境中进行动作分类,并与动画设计的仿生视觉系统相结合。该数据集是作为一项研究的一部分收集的,该研究旨在改善实时人体动作识别,以增强虚拟现实 (VR) 和增强现实 (AR) 环境中的沉浸式体验。参与者:数据来自 30 名参与者(15 名男性和 15...
-
垃圾短信垃圾邮件收集数据集
2024年11月9日 30 170 132
从 Grumbletext 网站手动提取了 425 条垃圾短信。这是一个英国论坛,手机用户在此公开声明垃圾短信,但大多数用户并未报告收到的垃圾短信。 NUS SMS Corpus (NSC) 的 3,375 条随机选择的 SMS 短信子集,该数据集包含约 10,000...
-
家庭用电研究数据
2024年11月9日 30 71 59
该数据集包含近四年来某个家庭用电量的详细测量数据。该数据以一分钟的采样率收集,可深入了解该家庭的各种电量和分表值。该数据集包含 2,075,259 个观测值,涵盖 2006 年 12 月至 2010 年 11 月期间的数据。...
-
纳米粒子电子结构数据集
2024年11月9日 30 38 30
atom_count:每个纳米粒子中的原子数,范围从 19 到 140。 structure_type:纳米粒子结构类型,随机分配为“立方八面体”、“二十面体”或“立方体”。 atomic_number:表示元素的原子序数,主要选择贵金属的典型值(例如,Pt 为 78,Au 为 79)。 电负性:代表金属元素的合成电负性值介于 2.0 和 3.0...
-
智能手机使用和行为数据集
2024年11月9日 30 165 94
该数据集深入了解了 1,000 名用户的日常移动设备使用模式,涵盖了屏幕时间、应用程序使用情况以及不同应用程序类别的用户参与度等方面。它涵盖了基于年龄、性别和地点的多样化用户。数据主要关注应用程序的总体使用情况、在社交媒体、生产力和游戏应用程序上花费的时间以及总体屏幕时间。
-
NBA 2K25 球员数据集
2024年11月9日 60 114 84
该数据集包含 2K 开发的 NBA 2K25 游戏中列出的所有球员数据。数据集由三大部分组成,即球员的个人资料、属性和徽章。目前,由于我在代码中添加了验证过程算法,因此不再有因网络抓取工具的连接问题而导致的数据丢失。很快我将添加每个球员的热点区域的数据。
-
冒犯性语言文本数据集(英文)
2024年11月9日 30 153 147
数据以CSV格式和pickled pandas数据框(Python 2.7)存储。 count = 编码每条推文的CrowdFlower用户数量(最小值为3,有时当CF判断推文不可靠时,会有更多用户编码一条推文)。 hate_speech = 判断推文为仇恨言论的CF用户数量。 offensive_language =...
-



