-
NBA 2K25 球员数据集
该数据集包含 2K 开发的 NBA 2K25 游戏中列出的所有球员数据。数据集由三大部分组成,即球员的个人资料、属性和徽章。目前,由于我在代码中添加了验证过程算法,因此不再有因网络抓取工具的连接问题而导致的数据丢失。很快我将添加每个球员的热点区域的数据。
-
森林火灾大数据数据集
这个数据集包含森林火灾的详细记录,为理解和预测火灾发生提供了宝贵的数据。它可以用于各种目的,包括火灾探测、火灾风险建模和分类任务。该数据集包含许多与影响森林火灾的地理、环境和天气条件相关的特征,使其适合用于机器学习模型,特别是用于火灾探测和分类任务。
-
冒犯性语言文本数据集(英文)
数据以CSV格式和pickled pandas数据框(Python 2.7)存储。 count = 编码每条推文的CrowdFlower用户数量(最小值为3,有时当CF判断推文不可靠时,会有更多用户编码一条推文)。 hate_speech = 判断推文为仇恨言论的CF用户数量。 offensive_language =...
-
利用机器学习进行简历筛选数据集
为一个职位筛选数千份简历。对于劳动密集型、正在增长或高流失率的企业来说,这项任务更具挑战性。聘用合适的人才至关重要,但当申请人数之巨超出传统招聘流程的承受能力时,招聘难度就会加大。这时简历筛选就派上用场了,这是从众多简历中找出合格候选人的重要步骤。
-
-
护肤品成分数据集
对于希望有效解决特定皮肤问题的消费者来说,了解护肤成分至关重要。此数据集来自renude.co,这是一家健康科技初创公司,致力于为其用户提供有关各种日常护肤的详细信息和护肤建议。创建此数据集的主要动机是开发一个聊天机器人,可以建议用户哪些成分对他们的特定护肤需求有益。该数据集包含有关护肤成分的全面信息,包括其描述、功效、对不同皮肤类型的适用性等
-
供应链成本优化数据集
该数据集专为供应链优化问题而设计,其目标是在满足客户需求的同时最小化总运输和库存成本。该数据集包含有关多个供应商、客户、运输成本和其他物流相关参数的信息。 供应商:此数据集包含五个供应商(供应商 1 至供应商 5)。每个供应商都有特定的供应能力和相关成本。客户:六个客户(客户 1 至客户 6)有特定需求要求,需要供应商满足。...
-
工厂工人的日常表现和流失关系数据集
该合成数据集包含一家工厂 18 个月的日常绩效和人员流失数据(411,948 个观测值),该工厂的组织结构由 508 名工人组成。由于员工流动,数据集中总共出现了 687...
-
根据人口统计数据预测度假偏好的数据集
该数据集旨在分析公众对两种热门度假类型(山脉和海滩)的偏好。它深入了解了可能影响这些偏好的各种人口和生活方式因素。通过探索此数据集,用户可以应用多种机器学习技术来根据个人属性预测他们更喜欢山脉还是海滩。
-
蛋白质RNA文本数据集
该数据集包含从 Wikipedia API 中提取的科学文本,重点关注与 RNA 和蛋白质相关的主题。它有两个 CSV 文件:一个是葡萄牙语,另一个是英语。该项目的目标是探索使用语言模型 (LLM) 和快速工程技术来识别与可能成为药物或疫苗开发潜在候选物的蛋白质相关的关键词。此外,该数据集可用于机器学习方法,使用...
-
超级英雄力量分析
该数据集提供了来自不同漫画世界的 675 位超级英雄和反派的详细信息。它包括各种属性,例如力量统计数据、传记信息、外貌和从属关系。数据是使用 SuperHero API 收集的,为研究人员和数据爱好者提供了丰富的资源,可用于分析、机器学习项目和漫画人物研究。 全面涵盖 675 个漫画人物 每个角色有 26 种属性,包括力量统计、传记和外观,以及...
-
ChatGPT 提示语数据集
Awesome ChatGPT Prompts 数据集是精心挑选的创意和实用提示集合,旨在激发和促进使用 OpenAI 的 GPT 模型进行对话。该数据集包含 170 个提示,涵盖多个领域和角色,例如讲故事、编码、搜索引擎优化、旅行指南甚至单口喜剧。每个提示都经过量身定制,以模拟特定的现实场景,可用于训练或探索对话式 AI 模型的功能。从充当...
-
TicTacToe Q 学习表数据集
这是一个 json 文件,包含井字游戏的所有 5890 个有效配置。最初应该有 19,683 个配置,但在删除所有不可能的组合后,我们只剩下这个数字 5890这个数据集的独特之处在于它不知道 AI 扮演什么位置。但建议让 AI(代理)扮演 X(第一步),以便让它领先一步。显然,如果你想让代理在学会扮演 X 之后扮演 O,你需要另一个相同的 q...
-
Solana 历史数据 2021 - 2024
该数据集包括 2021 年 1 月 1 日至 2024 年 9 月 29 日 Solana (SOL) 的每日价格和交易量数据。 数据包括用于分析 Solana 随时间的表现和趋势的基本交易指标。这些指标可用于预测、交易策略或其他财务分析。
-
geoleaderboard 排行榜数据
该数据集为geoleaderboard 网站提供全面的排行榜数据,每日更新。它包括排名、用户名、国家、评级、分区、移动评级、无移动评级和 NMPZ 评级等列。非常适合跟踪玩家表现并分析 GeoGuessr 游戏中的模式。
-
ChatGPT 用户评论数据集
该数据集包含每日更新的 ChatGPT Android 应用用户评论和评分。该数据集包含几个关键属性,可捕捉评论的各个方面,从而深入了解用户体验和随时间变化的反馈。数据来源:数据是通过 Google Play 商店中 ChatGPT Android...
-
AI 传感器的高级信号处理数据集
该数据集由Emirhan Bulut ( kaggle.com/emirhanai ) 创建 高分辨率信号数据:来自最先进传感器的详细读数,包括雷达、声纳和红外系统。 AI 系统输出:反映 AI 对传感器输入的处理的数据,例如目标识别和威胁评估。 操作日志:人工智能系统在各种模拟场景中的决策和行动的记录。...
-
以太坊历史数据集2018-2024
以太坊由 Vitalik Buterin 于 2015 年推出,是一个去中心化的区块链平台,支持智能合约和去中心化应用程序 (dApps)。它引入了其原生加密货币以太币 (ETH),为其网络提供动力。以太坊的创新技术推动了显著增长,使其成为去中心化金融 (DeFi) 和 NFT 的基础。 该数据集的历史以太坊价格包括 2018 年 9 月 4 日至...
-
多种健身锻炼数据集
该数据集提供了 50 种旨在促进整体健康和健身的各种锻炼的详细信息。它包括适合初学者到高级健身爱好者的各种活动,针对不同的肌肉群和健身目标。这些数据可用于个人健身计划、锻炼应用开发或健康和运动科学的数据分析项目。 锻炼名称:锻炼的通用名称。 类型:字符串 描述:数据集中每个锻炼的唯一标识符。 组数:建议练习的组数。 类型:整数...
-
人工智能助力美国交通部统计
数据用途简介:评估不同AI用例在交通领域的应用现状和发展潜力,识别关键技术和应用趋势。 分析AI技术对交通系统效率和安全性的影响,支持交通管理和公共安全策略的制定。 研究联邦机构在AI技术使用中的最佳实践,促进跨部门合作和知识共享。 支持AI技术供应商和交通企业了解市场需求,优化产品和服务设计。 为学术研究提供基础数据,推动交通工程和人工智能领域的创新研究。



