找到50,515个数据集

标签: 开发者

过滤结果
  • Douban Conversation Corpus豆瓣会话语料库

    2024年11月10日   

    豆瓣会话语料库,这是第一个用于基于检索的聊天机器人的人工标记测试集。
    packageimg
  • ChemData700K

    2024年11月10日   

    ChemData700K 是一个包含了九项化学核心任务,730K个高质量问答的大语言模型化学能力指令微调数据集.ChemData是大模型语料数据联盟成员单位上海人工智能实验室 AI for Science团队精心构建的大规模数据集,旨在为化学语言模型的微调提供支持,从而提高、释放其全部化学潜力。
    packageimg
  • 全国产业园区经纬度数据(2024年)

    2024年11月10日   

    数据名称:全国产业园区经纬度数据(2024年) 数据范围:2024年全国产业园区经纬度数据 数据时间:2024年1月 数据说明:数据包含2024年1月全国产业园区经纬度数据;数据格式为DTA 数据来源:互联网数据
    packageimg
  • 疾病分类与代码国家临床版2.0

    2024年11月10日   

    此数据不仅可作为疾病与死因分类的培训教材,也是指导广大卫生统计人员、病案人员、医务工作者、信息技术人员和管理人员正确理解和使用新的国家标准的工具书和参考书;对提高我国疾病分类水平,提升统计数据质量,规范医疗服务管理,促进统计和信息化建设都将发挥十分重要的作用。
    packageimg
  • 智能手机使用和行为数据集

    2024年11月9日   

    该数据集深入了解了 1,000 名用户的日常移动设备使用模式,涵盖了屏幕时间、应用程序使用情况以及不同应用程序类别的用户参与度等方面。它涵盖了基于年龄、性别和地点的多样化用户。数据主要关注应用程序的总体使用情况、在社交媒体、生产力和游戏应用程序上花费的时间以及总体屏幕时间。
    packageimg
  • 优化机器停机时间数据集

    2024年11月9日   

    该数据集包含有关各种机器的运行参数及其停机记录的信息, 该数据集可用于分析机器性能,预测潜在故障,并根据运行参数制定预测性维护策略。
    packageimg
  • 预测性维护 NASA 涡扇发动机数据集

    2024年11月9日   

    事实证明,深度学习在某些领域(例如对象识别和图像分类)表现出色。它在金融等领域也越来越受欢迎,因为时间序列数据在其中发挥着重要作用。预测性维护也是一个领域,它会随时间收集数据以监控资产的状态,目的是找到预测故障的模式,这也可以从某些深度学习算法中受益。在深度学习方法中,长短期记忆 (LSTM)...
    packageimg
  • 用于 LLM 微调的土耳其农业数据集

    2024年11月9日   

    该数据集旨在微调 T3 AI 土耳其语 LLM。它由 Barathan Aslan、Ömer Faruk Çelik 和 Batuhan Kalem 为 T3 AI Hackathon 创建。该数据集专注于土耳其农业。
    packageimg
  • 微型燃气轮机的电能预测

    2024年11月9日   

    该数据集包括从一台 3 千瓦商用微型燃气轮机收集的与输入控制信号相对应的电功率随时间变化的测量值。 该数据集包含八个时间序列,描述了燃气轮机在不同条件下的行为。每个时间序列代表一个单独的实验,其中输入控制电压随时间变化,并测量微型燃气轮机由此产生的输出电功率。时间序列的持续时间从 6,495 到 11,820 个数据点不等,分辨率约为 1...
    packageimg
  • NBA 2K25 球员数据集

    2024年11月9日   

    该数据集包含 2K 开发的 NBA 2K25 游戏中列出的所有球员数据。数据集由三大部分组成,即球员的个人资料、属性和徽章。目前,由于我在代码中添加了验证过程算法,因此不再有因网络抓取工具的连接问题而导致的数据丢失。很快我将添加每个球员的热点区域的数据。
    packageimg
  • 森林火灾大数据数据集

    2024年11月9日   

    这个数据集包含森林火灾的详细记录,为理解和预测火灾发生提供了宝贵的数据。它可以用于各种目的,包括火灾探测、火灾风险建模和分类任务。该数据集包含许多与影响森林火灾的地理、环境和天气条件相关的特征,使其适合用于机器学习模型,特别是用于火灾探测和分类任务。
    packageimg
  • 冒犯性语言文本数据集(英文)

    2024年11月9日   

    数据以CSV格式和pickled pandas数据框(Python 2.7)存储。 count = 编码每条推文的CrowdFlower用户数量(最小值为3,有时当CF判断推文不可靠时,会有更多用户编码一条推文)。 hate_speech = 判断推文为仇恨言论的CF用户数量。 offensive_language =...
    packageimg
  • 利用机器学习进行简历筛选数据集

    2024年11月9日   

    为一个职位筛选数千份简历。对于劳动密集型、正在增长或高流失率的企业来说,这项任务更具挑战性。聘用合适的人才至关重要,但当申请人数之巨超出传统招聘流程的承受能力时,招聘难度就会加大。这时简历筛选就派上用场了,这是从众多简历中找出合格候选人的重要步骤。
    packageimg
  • 机器设备运行优化数据集

    2024年11月9日   

    该数据集包含有关各种机器的运行参数及其停机记录的信息, 该数据集可用于分析机器性能,预测潜在故障,并根据运行参数制定预测性维护策略。
    packageimg
  • 护肤品成分数据集

    2024年11月9日   

    对于希望有效解决特定皮肤问题的消费者来说,了解护肤成分至关重要。此数据集来自renude.co,这是一家健康科技初创公司,致力于为其用户提供有关各种日常护肤的详细信息和护肤建议。创建此数据集的主要动机是开发一个聊天机器人,可以建议用户哪些成分对他们的特定护肤需求有益。该数据集包含有关护肤成分的全面信息,包括其描述、功效、对不同皮肤类型的适用性等
    packageimg
  • 供应链成本优化数据集

    2024年11月9日   

    该数据集专为供应链优化问题而设计,其目标是在满足客户需求的同时最小化总运输和库存成本。该数据集包含有关多个供应商、客户、运输成本和其他物流相关参数的信息。 供应商:此数据集包含五个供应商(供应商 1 至供应商 5)。每个供应商都有特定的供应能力和相关成本。客户:六个客户(客户 1 至客户 6)有特定需求要求,需要供应商满足。...
    packageimg
  • 工厂工人的日常表现和流失关系数据集

    2024年11月9日   

    该合成数据集包含一家工厂 18 个月的日常绩效和人员流失数据(411,948 个观测值),该工厂的组织结构由 508 名工人组成。由于员工流动,数据集中总共出现了 687...
    packageimg
  • 根据人口统计数据预测度假偏好的数据集

    2024年11月9日   

    该数据集旨在分析公众对两种热门度假类型(山脉和海滩)的偏好。它深入了解了可能影响这些偏好的各种人口和生活方式因素。通过探索此数据集,用户可以应用多种机器学习技术来根据个人属性预测他们更喜欢山脉还是海滩。
    packageimg
  • 蛋白质RNA文本数据集

    2024年11月9日   

    该数据集包含从 Wikipedia API 中提取的科学文本,重点关注与 RNA 和蛋白质相关的主题。它有两个 CSV 文件:一个是葡萄牙语,另一个是英语。该项目的目标是探索使用语言模型 (LLM) 和快速工程技术来识别与可能成为药物或疫苗开发潜在候选物的蛋白质相关的关键词。此外,该数据集可用于机器学习方法,使用...
    packageimg
  • 超级英雄力量分析

    2024年11月9日   

    该数据集提供了来自不同漫画世界的 675 位超级英雄和反派的详细信息。它包括各种属性,例如力量统计数据、传记信息、外貌和从属关系。数据是使用 SuperHero API 收集的,为研究人员和数据爱好者提供了丰富的资源,可用于分析、机器学习项目和漫画人物研究。 全面涵盖 675 个漫画人物 每个角色有 26 种属性,包括力量统计、传记和外观,以及...
    packageimg