-
NIH 平衡胸部 X 光检查
2025年2月13日 220 145 76
将高度不平衡的数据集转换为具有 1024x1024 图像的平衡数据集 关于此文件 标签的独热编码格式 小路 肺不张 心脏扩大 合并 浮肿 积液 气肿 纤维化 疝 浸润 大量的 未发现 结核 胸膜增厚 肺炎 气胸 -
材料寿命预测数据集
2025年2月13日 100 63 40
该数据集包含用于预测工业部件所用材料寿命(以小时为单位)的模拟数据。它包括与材料成分、制造工艺和结构缺陷相关的各种特征。该数据集非常适合探索回归技术、特征工程和材料科学应用。 列 PredictedHours:代表预测寿命(以小时为单位)的目标变量。 ComponentType:组件的类型(例如喷嘴、叶片、块体)。... -
PyTorch 几何外部库
2025年2月13日 190 50 34
用于 Kaggle Env 的 PyTorch 几何外部库轮子 该数据集是 PyTorch Geometric外部库的 Python wheel 包文件(只需安装PyG即可) 。PyTorch pip install torch_geometricGeometric 是用于构建图神经网络的 torch... -
GPT GCJ 数据集:检测 LLM 编写的 Java 代码
2025年2月13日 300 207 132
来自 GCJ 2020 的 76K+ Java 文件,其中 17K 由 GPT-4o 生成,用于 AI 检测 GPT Java GCJ 源代码数据集 该数据集由 2020 年 Google Code Jam 竞赛中 1,000 多位作者编写的共 76,089 个 Java 源代码文件和用于代码生成检测的 GPT-4o 重写代码组成。 随着 OpenAI... -
-
DUTS 大规模图像显著性检测基准数据集
2025年2月13日 179 198 168
DUTS 是一个大规模显著性检测数据集,包含 10,553 张训练图像和 5,019 张测试图像。所有训练图像均来自ImageNet DET 训练/验证集,而测试图像则来自 ImageNet DET 测试集和SUN 数据集。训练集和测试集都包含对显著性检测非常具有挑战性的场景。精确的像素级基本事实由 50 名受试者手动注释。 -
Udacity 自动驾驶汽车数据集:用于自动驾驶物体检测的重新标记和增强
2025年2月13日 398 137 66
Udacity 自动驾驶汽车 > 固定小”数据集是经过精心策划和重新标记的图像集合,专为自动驾驶应用中的对象检测任务而设计。它通过纠正行人、骑自行车的人、车辆和交通灯等关键对象的缺失标签来解决原始 Udacity 数据集的缺点。该数据集包含 15,000 张高分辨率图像 (1920x1200) 和跨越 11 个类别的总共 97,942... -
鱼类探测(带标签)
2025年2月13日 285 168 46
鱼类物种检测数据集是一个经过精心策划的集合,旨在开发和测试专注于识别各种鱼类物种的物体检测模型。借助此数据集,研究人员和开发人员可以利用先进的计算机视觉技术对各种水生环境中的鱼类进行分类。 数据集组成 该数据集共包含 8,242 张带注释的图像,分为十三个不同的鱼类: 神仙鱼 蓝唐 蝴蝶鱼 小丑鱼 金鱼 丝足鱼 莫里什偶像 孔雀鱼 带状甜唇 三条纹雀鲷... -
英国 36 个站点的历史气象站数据
2025年2月13日 300 209 28
英国气象局自 1854 年成立以来一直负责监测英国天气。英国有 36 个气象站(通常位于皇家空军基地)收集信息,用于预测未来天气模式并发布公共建议。最近,这些大型数据集已成为调查英国气候在过去 150 多年中如何变化的有用工具。 内容 列: year:进行测量的年份 month:进行测量的月份 tmax:平均每日最高气温(℃)... -
ESG Ratings and Stock Data for Dow 30 Companies
2025年2月13日 267 40 35
该数据集可帮助您比较截至 2024 年 6 月道琼斯 30 指数公司的来自 4 家不同 ESG 提供商(包括 ESGAnalytics.io、Sustainalytics、S&P Global 和 MSCI)的 ESG 评级和股票市场信息。 Unique_id 从 ESGAnalytics.io 中提取所跟踪公司的唯一 ID 象征... -
Slovo:俄罗斯手语(RSL)识别的视频数据集
2025年2月13日 200 38 1
Slovo - 俄罗斯手语数据集 我们引入了一个用于俄罗斯手语任务的大规模视频数据集Slovo。Slovo数据集大小约为16 GB,包含来自 194 位歌手的1000 个手语手势的20400 个RGB 视频。每类有 20 个样本。数据集按主题分为训练集和测试集。训练集包括 15300 个视频,测试集包括 5100 个视频。总视频录制时间约为 9.2... -
狗牌照数据集:纽约市有效狗证
2025年2月13日 400 67 42
根据法律规定,居住在纽约市的所有狗主人都必须为他们的狗办理许可证。数据来源于 DOHMH 狗许可证系统,狗主人可以在此申请和续签狗许可证。 每条记录代表了该年内有效的唯一狗执照,但不一定是每只狗的唯一记录,因为在年内续签的执照会产生有效执照期限的单独记录。每条记录代表了该只狗在一年的时间范围内的一个唯一执照期限。... -
自适应信号中继数据集
2025年2月13日 286 37 20
该数据集提供了有关部署在山区的网络节点的全面详细信息,重点关注其 GPS 位置、能量特性、信号性能以及在网络中的作用。它包含 5000 行,每行代表一个独特的网络节点及其相关属性。该数据集旨在分析和优化无线通信系统,特别是在山区等具有挑战性的环境中。 主要特点: Node_ID:每个网络节点的唯一标识符。GPS_Latitude... -
PCB 缺陷数据集(带有 YOLO 注释)
2025年2月13日 200 180 63
内容 数据集中定义的缺陷有:缺孔、鼠咬、断路、短路、毛刺、杂散铜。北京大学人机交互开放实验室发布了PCB缺陷数据集。扩充后的数据集包含10668张图片和相应的标注文件。 致谢 R. Ding、L. Dai、G. Li 和 H. Liu,“TDD-net:用于印刷电路板的微型缺陷检测网络”,载于《CAAI 智能技术学报》,第 4 卷,第 2 期,第... -
乳腺癌预测
2025年2月13日 285 95 80
数据集信息: 特征是根据乳腺肿块细针抽吸物 (FNA) 的数字化图像计算得出的。这些特征描述了细胞核的特征。 上述分离平面是使用多表面方法树 (MSM-T) [KP Bennett,“通过线性规划构建决策树”。第四届中西部人工智能和认知科学学会论文集,第 97-101 页,1992] 获得的,这是一种使用线性规划构建决策树的分类方法。相关特征是在... -
507 名身体活跃人士的身体测量数据
2025年2月13日 300 51 21
关于数据集 给出了 507 名身体活跃人士(247 名男性和 260 名女性)的周长和骨骼直径测量值以及年龄、体重、身高和性别。这些数据可用于为统计学学生提供数据分析方面的练习。此类分析范围从简单的描述性显示到更复杂的多变量分析,例如多元回归和判别分析。 数据 bia_di 一个数值向量,受访者的双肩峰直径(以厘米为单位)。 bii_di... -
FSL 数据集
2025年2月13日 150 123 53
FSL 数据集,26 个字母,每个字母 450 张图片,总共 11700 张图片 菲律宾手语字母表的数据集,包含 26 个字母,每个字母有 450 张图片,共计 11700 张图片。该数据集由研究人员在网络摄像头前做出手势创建,然后对视频进行处理以裁剪手部区域,并将其调整为当前尺寸。 -
2010 年至 2023 年雅加达每日空气质量指数 (AQI)
2025年2月13日 330 148 37
该数据集包含 2010 年至 2023 年期间雅加达特区 5 个空气质量监测站 (SPKU) 测得的空气质量指数 (AQI) 或空气质量标准指数 (ISPU)。 文件描述 在此数据集中,有两种类型的文件: ispu_dki x:此文件代表每个监测站的 AQI 测量结果。“x”是站点序列号。此文件包含从2010 年到 2021 年的测量结果。... -
菲律宾地震(来自菲律宾地震研究所)2016-2025
2025年2月13日 235 165 152
该研究所的国家地震监测和信息旨在提供可能对菲律宾产生重大影响的重大地震和海啸事件的准确和及时的信息;并确保地震数据的可访问性和完整性。随着九十二 (92) 个地震网络的运行,该国的地震监测得到了加强,其中十 (10) 个地震台站于 2016 年投入使用。菲律宾地震和地震部在 2010 年拥有 64 个台站,并超额完成了到 2016 年底建立 85... -
用于天气分类的多类图像
2025年2月12日 300 32 10
用于图像分类的多类天气数据集 (MWD) 是研究论文《使用异构集成方法从静态图像中进行多类天气识别》中使用的宝贵数据集。该数据集通过提取各种特征来识别不同的天气状况,为户外天气分析提供了一个平台。