找到56,338个数据集

标签: 开发者

过滤结果
  • 建立团队的分析方法:原神角色列表 5.2 版

    2025年2月14日   

    该数据集包含《原神》5.2 版以来的所有角色 创建此数据集是为了让像我这样的有抱负的数据分析师能够以独特而有趣的方式练习处理数据。下载数据集的用户可以练习使用数据可视化,并在玩《原神》时根据自己的需求快速访问角色信息。
    packageimg
  • 用于 NLP 任务的高质量金融新闻数据集

    2025年2月13日   

    此存储库包含从各个金融网站精心抓取的数据集。数据提取过程可确保文本高质量且准确,包括网站及其嵌入 PDF 的内容。 数据集特征 日期: 公告日期。 主题:财经新闻的主题。 内容:公告的全部内容,包括网站文本和 PDF。 附加处理字段 我们应用先进的 Mixtral 7X8 模型来生成以下附加字段:...
    packageimg
  • 用于文本检测的尼泊尔手写图像:各个年龄段的详尽文本数据集

    2025年2月13日   

    尼泊尔手写数据集 (NHD),它是尼泊尔各个地区用相机捕捉的尼泊尔手写文本图像的集合。该数据集旨在为研究人员探索手写检测和识别新技术提供基准。我们还提供了使用成熟的深度学习框架进行文本定位和识别的基准结果。数据集和基准结果可在此处获得。 主要特点:...
    packageimg
  • 皮肤癌 - HAM10000:常见色素性皮肤病变的多源皮肤镜图像

    2025年2月13日   

    包含3个文件夹和2个文件组成,如下表所述。 内容 类型 描述 HAM10000_images_part_1 文件夹 一组训练图片的第一部分 HAM10000_images_part_2 文件夹 一组训练图片的第二部分 ISIC2018_Task3_Test_Images 文件夹 测试图片集 HAM10000_metadata.csv 文件...
    packageimg
  • geoleaderboard 网站上使用的排行榜数据

    2025年2月13日   

    该数据集为geoleaderboard 网站提供全面的排行榜数据,每日更新。它包括排名、用户名、国家、评级、分区、移动评级、无移动评级和 NMPZ 评级等列。非常适合跟踪玩家表现并分析 GeoGuessr 游戏中的模式。
    packageimg
  • 揭开社交媒体的情感面纱:Twitter 情感数据集

    2025年2月13日   

    利用我们精心整理的数据集,深入了解通过 Twitter 消息表达的人类情感的复杂世界。这个综合集合中的每个条目都包含从 Twitter 中提取的一段文本,并附有相应的标签,表示消息传达的主要情感。情绪被精心分为六个不同的类别:悲伤 (0)、快乐 (1)、爱 (2)、愤怒 (3)、恐惧 (4) 和惊讶 (5)。...
    packageimg
  • 核聚变实验的模拟数据

    2025年2月13日   

    核能聚变实验的模拟数据集对于对核聚变领域感兴趣的研究人员和爱好者来说都是宝贵的资源。该数据集由 100,000 行组成,每行代表一个实验,并包含各种对于了解聚变反应成功或失败至关重要的参数。这些参数包括燃料密度、温度、约束时间、燃料纯度、能量输入、功率输出、压力和中子产量等。...
    packageimg
  • 植物疾病检测数据集

    2025年2月13日   

    植物疾病数据集由印度理工学院的一组研究人员创建,最初在一篇研究论文中进行了描述。其中一位作者 Pratik Kayal 已在GitHub上分享了该数据集,可供公众使用。PlantDoc 数据集包含 13 种不同植物物种的总共 2,569 张图像。该数据集分为 30 个不同的类别,标签指示每张图像是健康的还是患病的。数据集内共有 8,851...
    packageimg
  • 用于对印地语 NCERT 科学教科书上的 Gemma 2 进行微调的结构化数据集

    2025年2月13日   

    该数据集经过精心设计,旨在微调 Gemma 2 语言模型,以生成印地语教育内容,专门针对 3 年级至 10 年级的科学主题。该数据集使用印地语 NCERT 教科书构建,由三个结构化组件组成,可实现有效的语言模型训练。 数据集组件 1. 图书数据 包含 3 年级至 10 年级印地语 NCERT 科学教科书的 PDF 文件。...
    packageimg
  • NIH 平衡胸部 X 光检查

    2025年2月13日   

    将高度不平衡的数据集转换为具有 1024x1024 图像的平衡数据集 关于此文件 标签的独热编码格式 小路 肺不张 心脏扩大 合并 浮肿 积液 气肿 纤维化 疝 浸润 大量的 未发现 结核 胸膜增厚 肺炎 气胸
    packageimg
  • 材料寿命预测数据集

    2025年2月13日   

    该数据集包含用于预测工业部件所用材料寿命(以小时为单位)的模拟数据。它包括与材料成分、制造工艺和结构缺陷相关的各种特征。该数据集非常适合探索回归技术、特征工程和材料科学应用。 列 PredictedHours:代表预测寿命(以小时为单位)的目标变量。 ComponentType:组件的类型(例如喷嘴、叶片、块体)。...
    packageimg
  • PyTorch 几何外部库

    2025年2月13日   

    用于 Kaggle Env 的 PyTorch 几何外部库轮子 该数据集是 PyTorch Geometric外部库的 Python wheel 包文件(只需安装PyG即可) 。PyTorch pip install torch_geometricGeometric 是用于构建图神经网络的 torch...
    packageimg
  • GPT GCJ 数据集:检测 LLM 编写的 Java 代码

    2025年2月13日   

    来自 GCJ 2020 的 76K+ Java 文件,其中 17K 由 GPT-4o 生成,用于 AI 检测 GPT Java GCJ 源代码数据集 该数据集由 2020 年 Google Code Jam 竞赛中 1,000 多位作者编写的共 76,089 个 Java 源代码文件和用于代码生成检测的 GPT-4o 重写代码组成。 随着 OpenAI...
    packageimg
  • DUTS 大规模图像显著性检测基准数据集

    2025年2月13日   

    DUTS 是一个大规模显著性检测数据集,包含 10,553 张训练图像和 5,019 张测试图像。所有训练图像均来自ImageNet DET 训练/验证集,而测试图像则来自 ImageNet DET 测试集和SUN 数据集。训练集和测试集都包含对显著性检测非常具有挑战性的场景。精确的像素级基本事实由 50 名受试者手动注释。
    packageimg
  • 鱼类探测(带标签)

    2025年2月13日   

    鱼类物种检测数据集是一个经过精心策划的集合,旨在开发和测试专注于识别各种鱼类物种的物体检测模型。借助此数据集,研究人员和开发人员可以利用先进的计算机视觉技术对各种水生环境中的鱼类进行分类。 数据集组成 该数据集共包含 8,242 张带注释的图像,分为十三个不同的鱼类: 神仙鱼 蓝唐 蝴蝶鱼 小丑鱼 金鱼 丝足鱼 莫里什偶像 孔雀鱼 带状甜唇 三条纹雀鲷...
    packageimg
  • Slovo:俄罗斯手语(RSL)识别的视频数据集

    2025年2月13日   

    Slovo - 俄罗斯手语数据集 我们引入了一个用于俄罗斯手语任务的大规模视频数据集Slovo。Slovo数据集大小约为16 GB,包含来自 194 位歌手的1000 个手语手势的20400 个RGB 视频。每类有 20 个样本。数据集按主题分为训练集和测试集。训练集包括 15300 个视频,测试集包括 5100 个视频。总视频录制时间约为 9.2...
    packageimg
  • 自适应信号中继数据集

    2025年2月13日   

    该数据集提供了有关部署在山区的网络节点的全面详细信息,重点关注其 GPS 位置、能量特性、信号性能以及在网络中的作用。它包含 5000 行,每行代表一个独特的网络节点及其相关属性。该数据集旨在分析和优化无线通信系统,特别是在山区等具有挑战性的环境中。 主要特点: Node_ID:每个网络节点的唯一标识符。GPS_Latitude...
    packageimg
  • PCB 缺陷数据集(带有 YOLO 注释)

    2025年2月13日   

    内容 数据集中定义的缺陷有:缺孔、鼠咬、断路、短路、毛刺、杂散铜。北京大学人机交互开放实验室发布了PCB缺陷数据集。扩充后的数据集包含10668张图片和相应的标注文件。 致谢 R. Ding、L. Dai、G. Li 和 H. Liu,“TDD-net:用于印刷电路板的微型缺陷检测网络”,载于《CAAI 智能技术学报》,第 4 卷,第 2 期,第...
    packageimg
  • 乳腺癌预测

    2025年2月13日   

    数据集信息: 特征是根据乳腺肿块细针抽吸物 (FNA) 的数字化图像计算得出的。这些特征描述了细胞核的特征。 上述分离平面是使用多表面方法树 (MSM-T) [KP Bennett,“通过线性规划构建决策树”。第四届中西部人工智能和认知科学学会论文集,第 97-101 页,1992] 获得的,这是一种使用线性规划构建决策树的分类方法。相关特征是在...
    packageimg
  • FSL 数据集

    2025年2月13日   

    FSL 数据集,26 个字母,每个字母 450 张图片,总共 11700 张图片 菲律宾手语字母表的数据集,包含 26 个字母,每个字母有 450 张图片,共计 11700 张图片。该数据集由研究人员在网络摄像头前做出手势创建,然后对视频进行处理以裁剪手部区域,并将其调整为当前尺寸。
    packageimg