-
预测性维护 NASA 涡扇发动机数据集
事实证明,深度学习在某些领域(例如对象识别和图像分类)表现出色。它在金融等领域也越来越受欢迎,因为时间序列数据在其中发挥着重要作用。预测性维护也是一个领域,它会随时间收集数据以监控资产的状态,目的是找到预测故障的模式,这也可以从某些深度学习算法中受益。在深度学习方法中,长短期记忆 (LSTM)... -
-
用于 LLM 微调的土耳其农业数据集
该数据集旨在微调 T3 AI 土耳其语 LLM。它由 Barathan Aslan、Ömer Faruk Çelik 和 Batuhan Kalem 为 T3 AI Hackathon 创建。该数据集专注于土耳其农业。 -
-
印度各城市犯罪数据
该数据集捕捉了 2020 年至 2024 年印度多个城市犯罪活动的全面快照。它包括有关犯罪类型、发生日期和时间、使用的武器、受害者人口统计数据以及警察部署级别的详细信息。该数据集的犯罪范围从身份盗窃到凶杀,为研究人员、政策制定者和执法机构提供了宝贵的见解,旨在了解犯罪模式并改善公共安全。该数据还包括有关案件是否已结案的信息,从而清楚地了解各个城市的犯罪解决率 -
-
以太坊 ETH7 个交易所1 个月完整历史数据
完整的 1 分钟数据:来自多个交易所的原始 1 分钟历史数据,涵盖通过其 API 端点提供的 ETHUSD 的整个交易历史。此数据集每天更新,以确保覆盖最新情况。组合指数数据集:此数据集的一个独特功能是组合指数,它是通过将所有其他数据集平均为一个而得出的,请参阅随附的笔记本。这将创建 Kaggle 上最长的连续、不间断的 ETHUSD... -
-
舞蹈音乐数据集
该数据集专为音乐信息检索 (MIR) 和人工智能 (AI) 技术的研究而设计,尤其侧重于将音乐曲目与适当的舞蹈风格进行匹配。该数据集包含合成音乐特征和舞蹈风格标签,适合开发为各种舞蹈形式提供音乐选择和搭配建议的智能系统。 -
NBA 2K25 球员数据集
该数据集包含 2K 开发的 NBA 2K25 游戏中列出的所有球员数据。数据集由三大部分组成,即球员的个人资料、属性和徽章。目前,由于我在代码中添加了验证过程算法,因此不再有因网络抓取工具的连接问题而导致的数据丢失。很快我将添加每个球员的热点区域的数据。 -
-
特斯拉和主要附属公司股票数据
该数据集包含特斯拉 (TSLA) 及其五家主要附属公司的每日股票数据:松下、LG 能源解决方案、CATL、塔塔钢铁和三星电子。这些公司在特斯拉的供应链中发挥着关键作用,提供电池、钢铁和半导体等基本材料,为特斯拉在电动汽车和可再生能源领域的成功做出了贡献。该数据集包括每家公司的股票表现指标,可用于分析、比较和洞察特斯拉与其合作伙伴之间的相互关联动态。 -
-
-
数字游戏成瘾数据集
经过彻底处理并可供分析。附加的第二个数据集经过了全面的预处理算法。此预处理包括数据清理、规范化和特征提取等步骤,以提高数据的质量和可用性。这些步骤对于确保数据集没有不一致、缺失值和不相关信息至关重要,从而提高后续机器学习模型的准确性和可靠性。 -
管癌的综合临床数据集
该数据集包括患者人口统计数据、临床数据和癌症特定属性,可用于开发用于检测、预后和治疗计划的 AI 模型。是从事癌症检测、个性化治疗和预后模型的医疗专业人士和研究人员的宝贵资源 -
森林火灾大数据数据集
这个数据集包含森林火灾的详细记录,为理解和预测火灾发生提供了宝贵的数据。它可以用于各种目的,包括火灾探测、火灾风险建模和分类任务。该数据集包含许多与影响森林火灾的地理、环境和天气条件相关的特征,使其适合用于机器学习模型,特别是用于火灾探测和分类任务。 -
全球人口数据
该数据集涵盖了从 1980 年到 2050 年的广泛时间跨度,可用于分析长期人口动态。它整合了联合国人口司和世界人口评论等知名来源的数据,确保数据的准确性和可靠性。 -
-