找到95,645个数据集

分类: 互联网数据 None: 数据

过滤结果
  • 38 个数据集中的微生物组差异

    2025年2月14日   

    微生物组差异丰度方法在 38 个数据集中产生不同的结果。 文章数据来自 Nat Commun
    packageimg
  • PCB 缺陷数据集(带有 YOLO 注释)

    2025年2月13日   

    内容 数据集中定义的缺陷有:缺孔、鼠咬、断路、短路、毛刺、杂散铜。北京大学人机交互开放实验室发布了PCB缺陷数据集。扩充后的数据集包含10668张图片和相应的标注文件。 致谢 R. Ding、L. Dai、G. Li 和 H. Liu,“TDD-net:用于印刷电路板的微型缺陷检测网络”,载于《CAAI 智能技术学报》,第 4 卷,第 2 期,第...
    packageimg
  • Valorant VCT 电子竞技数据

    2024年12月24日   

    数据是从 YouTube 上保存的 VCT(2023)数据的视频帧中手动收集的。使用 Tesseract OCR 将字幕转换为文本,并使用经过标记的枪支/盾牌图像训练的 Tensorflow CNN 确定枪支/盾牌。
    packageimg
  • 开普勒和 TESS 系外行星数据

    2025年2月10日   

    光变曲线、候选行星以及已确认的行星! 开普勒和 TESS 系外行星数据:光变曲线、候选行星和已确认行星” 📖描述: 该数据集包含通过凌日探测寻找系外行星所使用的开普勒和 TESS 任务关键数据。这些文件包括: 开普勒光变曲线物体 (TCE、KOI) → 潜在的系外行星凌日信号 已确认行星(PS、TOI、恒星宿主) → 已验证的系外行星及其轨道参数...
    packageimg
  • Maven Roasters:咖啡店销售和收入数据

    2024年12月15日   

    数据名称:Maven Roasters:咖啡店销售和收入数据 数据说明:该数据集非常适合探索随时间变化的销售趋势、确定客流量高峰日以及深入研究各种产品的性能指标。该数据集包含 Maven Roasters 的交易记录,Maven Roasters...
    packageimg
  • 求职者全面的职业角色洞察和常见问题:入门级职业 QA 数据集

    2025年2月18日   

    数据集:职业角色问答数据 集概述:职业角色问答数据集是针对多个行业中各种职业角色的综合问题和答案的集合。它为有志于从事或晋升这些职位的个人提供有关角色、职责、资格、技能、职业发展和日常任务的详细信息。 该数据集涵盖 50...
    packageimg
  • TicTacToe Q 学习表数据集

    2024年11月9日   

    这是一个 json 文件,包含井字游戏的所有 5890 个有效配置。最初应该有 19,683 个配置,但在删除所有不可能的组合后,我们只剩下这个数字 5890这个数据集的独特之处在于它不知道 AI 扮演什么位置。但建议让 AI(代理)扮演 X(第一步),以便让它领先一步。显然,如果你想让代理在学会扮演 X 之后扮演 O,你需要另一个相同的 q...
    packageimg
  • CSV中的CIFAR-10 Python数据集

    2024年12月15日   

    数据名称:CSV 中的 CIFAR-10 Python数据集 数据说明:CIFAR-10 数据集包含 10 个类别的 60000 张 32x32 彩色图像,每个类别有 6000 张图像。各个类别完全互斥。其中有 50000 张训练图像和 10000 张测试图像。 数据时间:截止 2021年 数据来源:互联网数据
    packageimg
  • 2007 年至今所有节拍图的 Osu 数据集

    2024年12月15日   

    数据名称:2007 年至今所有节拍图的 Osu 数据集 数据说明:一个全面的数据集,涵盖超过500 万个节拍图,每个节拍图有22 个特征,涵盖了 osu!从 2007 年成立至今的整个历史。 数据时间:更新于 2024年 数据来源:互联网数据
    packageimg
  • 1917年以来的 NHL 比赛数据、Elo评级和预测

    2025年2月18日   

    该数据集提供从联盟首个 1917-18 赛季至今的历史和实时 NHL Elo 评级、比赛预测和预报。该数据集来源于FiveThirtyEight 的 NHL Elo 模型,包括所有常规赛和季后赛比赛的逐场 Elo 评级、获胜概率和比赛重要性指标。 该数据集由两个文件组成: nhl_elo.csv– 包含自 1917 年以来所有 NHL 比赛的 Elo...
    packageimg
  • 用于 NLP 任务的高质量金融新闻数据集

    2025年2月13日   

    此存储库包含从各个金融网站精心抓取的数据集。数据提取过程可确保文本高质量且准确,包括网站及其嵌入 PDF 的内容。 数据集特征 日期: 公告日期。 主题:财经新闻的主题。 内容:公告的全部内容,包括网站文本和 PDF。 附加处理字段 我们应用先进的 Mixtral 7X8 模型来生成以下附加字段:...
    packageimg
  • 预测性维护 NASA 涡扇发动机数据集

    2024年11月9日   

    事实证明,深度学习在某些领域(例如对象识别和图像分类)表现出色。它在金融等领域也越来越受欢迎,因为时间序列数据在其中发挥着重要作用。预测性维护也是一个领域,它会随时间收集数据以监控资产的状态,目的是找到预测故障的模式,这也可以从某些深度学习算法中受益。在深度学习方法中,长短期记忆 (LSTM)...
    packageimg
  • 微策略公司 MSTR历史数据分析数据集

    2025年6月13日   

    数据概述: 本数据集提供了特定公司股票市场的历史表现数据。它包含了股票价格随时间推移的变动信息,使用户能够分析和理解股票价格的过去趋势和波动情况。数据通常涵盖了股票的开盘价、收盘价、最高价、最低价、成交量等关键指标,并按时间序列组织。 数据用途概述:...
    packageimg
  • 2024 年 MotoGP 车手表现数据集

    2025年3月9日   

    关于数据集 这是一个经过清理的数据集,涵盖了 22 名车手自开始 MotoGP 职业生涯以来的比赛见解。 车手名单仅限于 2024 年参加过比赛的车手 。它按赛季包括车手参加的所有级别。 数据集首先按自行车编号排序,然后按赛季排序。 该数据集可用于数据可视化。 提取代码可以在我的GitHub 上找到:MotoGP-RidersSummary-...
    packageimg
  • 房地产公司Brookfield Property Partners L.P.股票数据集

    2025年5月8日   

    数据概述: 本数据集包含了特定上市公司的历史股票市场表现数据。数据涵盖了股票价格随时间推移的变动情况,允许用户分析和理解股票价格的历史趋势和波动。数据集可能包含开盘价、收盘价、最高价、最低价、成交量等关键指标,并按时间序列进行组织。 数据用途概述:...
    packageimg
  • 危地马拉彩票Lotería Santa Lucía的历史数据

    2025年2月18日   

    数据集描述 该数据集包含危地马拉规模最大、历史最悠久的彩票Lotería Santa Lucía的历史数据。该数据集经过手动提取和转换,提供有关彩票抽奖、奖品和获奖者的清晰、结构化且易于分析的信息。它旨在支持统计分析、可视化和机器学习研究。 数据集结构 该数据集由两个主要的 CSV 文件组成: sorteos.csv- 包含每次彩票抽奖的元数据: 列:...
    packageimg
  • 使用 peft 和 lora 进行 LLM 微调的合成数据

    2025年2月14日   

    该数据集包含对话摘要、主题和对话,用于使用参数有效微调和大型语言模型的低秩自适应创建对 LLM 模型进行微调的管道,这是一种流行且轻量级的训练技术,可显着减少可训练参数的数量。 该数据集也可在 hugging face 中使用。https://huggingface.co/datasets/knkarthick/dialogsum
    packageimg
  • 2024 年英雄联盟 LCK 地区总决赛统计数据

    2024年12月24日   

    2024 年英雄联盟 LCK 地区总决赛所有比赛的比赛统计数据 大部分数据来自 Games of Legends以及英雄联盟 LCK Youtube 频道官方账号 数据集内容: 玩家:玩家的姓名。 角色:玩家的角色(例如,TOP、JUNGLE、MID、ADC、SUPPORT) 球队:玩家所在球队的名称 对手队伍:对手队伍的名称 对手球员:对手球员的姓名...
    packageimg
  • 用于 LLM 微调的土耳其农业数据集

    2024年11月9日   

    该数据集旨在微调 T3 AI 土耳其语 LLM。它由 Barathan Aslan、Ömer Faruk Çelik 和 Batuhan Kalem 为 T3 AI Hackathon 创建。该数据集专注于土耳其农业。
    packageimg