互联网数据 - 分类

使用 peft 和 lora 进行 LLM 微调的合成数据

2025年2月14日 200 28 3

该数据集包含对话摘要、主题和对话，用于使用参数有效微调和大型语言模型的低秩自适应创建对 LLM 模型进行微调的管道，这是一种流行且轻量级的训练技术，可显着减少可训练参数的数量。该数据集也可在 hugging face 中使用。https://huggingface.co/datasets/knkarthick/dialogsum

zip

房地产公司Brookfield Property Partners L.P.股票数据集

2025年5月8日 30 20 7

数据概述：本数据集包含了特定上市公司的历史股票市场表现数据。数据涵盖了股票价格随时间推移的变动情况，允许用户分析和理解股票价格的历史趋势和波动。数据集可能包含开盘价、收盘价、最高价、最低价、成交量等关键指标，并按时间序列进行组织。数据用途概述：...

zip

Kitsune 网络攻击数据集

2025年8月20日 50 27 8

实验室 IoT 网络正常+攻击流量

zip

纳斯达克：INM 制药公司股票表现历史数据分析数据集

2025年5月23日 30 28 8

数据概述：本数据集包含了特定公司股票的历史市场表现数据。它提供了股票价格随时间推移的详细信息，包括开盘价、收盘价、最高价、最低价、交易量等关键指标。数据的时间跨度、采样频率以及涵盖的公司数量将根据具体来源而有所不同。数据用途概述：...

zip

纳斯达克智能砂业公司Smart Sand, Inc.股票数据集

2025年5月7日 30 20 3

数据概述：本数据集提供了特定公司股票的历史市场表现数据，涵盖了股价随时间推移的变化情况。数据内容包括股票的开盘价、收盘价、最高价、最低价、交易量等关键指标，时间跨度通常为数年甚至更长，为用户提供了全面了解股票价格波动的基础信息。数据用途概述：...

zip

Malimg Malware Image 数据集

2025年8月20日 110 23 1

25个恶意家族，均为Windows PE样本

zip

GPT GCJ 数据集：检测 LLM 编写的 Java 代码

2025年2月13日 300 27 7

来自 GCJ 2020 的 76K+ Java 文件，其中 17K 由 GPT-4o 生成，用于 AI 检测 GPT Java GCJ 源代码数据集该数据集由 2020 年 Google Code Jam 竞赛中 1,000 多位作者编写的共 76,089 个 Java 源代码文件和用于代码生成检测的 GPT-4o 重写代码组成。随着 OpenAI...

zip
md

Rea Games 清除数据集

2024年12月24日 30 29 4

Rea Games 数据集提供了有关游戏行业的宝贵见解，提供有关游戏销售、玩家人口统计和用户参与度的详细数据。此数据集旨在进行探索性数据分析 (EDA)，以发现游戏行业内的模式和趋势，帮助分析师、游戏开发者和行业研究人员更好地了解玩家行为、收入驱动因素和热门游戏类型。数据集概述：游戏销售：各种游戏销售数据的详细信息，可用于收入分析和趋势识别。...

zip

美国NHANES成人体重和身高数据集-galserge

2025年5月4日 30 12 7

数据概述：本数据集来源于美国国家卫生统计中心进行的大型全国健康与营养调查的一部分，包含成年人（20至150岁）的体重、身高和身体质量指数（BMI）数据。数据集中的字段包括体重（公斤）、站立身高（厘米）和BMI（千克/平方米）。这些数据为研究体重与身高之间的关系以及成人健康状况提供了基础。数据用途概述：...

zip

第一信托多西·赖特焦点五号交易型开放式指数基金-FV股票走势数据集

2025年4月21日 30 20 4

数据概述：本数据集包含了特定公司股票的历史市场表现数据。数据详细记录了股票价格随时间的变化，包括开盘价、收盘价、最高价、最低价、成交量等关键指标，从而全面反映股票的交易情况和市场表现。数据集的时间跨度能够覆盖较长的历史时期，为用户提供分析股票价格长期趋势和短期波动的依据。数据来源可靠，确保了数据的准确性和完整性。数据用途概述：...

zip

FSL 数据集

2025年2月13日 150 28 5

FSL 数据集，26 个字母，每个字母 450 张图片，总共 11700 张图片菲律宾手语字母表的数据集，包含 26 个字母，每个字母有 450 张图片，共计 11700 张图片。该数据集由研究人员在网络摄像头前做出手势创建，然后对视频进行处理以裁剪手部区域，并将其调整为当前尺寸。

zip

Stitch Fix 时尚订阅平台股票历史数据集

2025年5月14日 30 22 8

数据概述：本数据集包含了特定公司的历史股票市场表现数据，涵盖了股票价格随时间推移的变动情况。数据集旨在帮助用户分析和理解股票价格的历史趋势和波动，从而为投资决策、财务研究和市场趋势预测提供数据支持。具体数据字段可能包括：日期、开盘价、收盘价、最高价、最低价、成交量等，数据的起止时间段根据具体公司和数据来源有所不同。数据用途概述：...

zip

瑞典博彩公司_EVO_历史股票数据集

2025年6月9日 30 29 9

数据概述：本数据集包含了特定公司的股票市场历史表现数据。它提供了股票价格随时间推移的详细记录，使得用户能够分析和理解股票价格的历史趋势和波动情况。数据通常包括开盘价、收盘价、最高价、最低价、成交量等关键指标，并按时间序列排列。数据用途概述：...

zip

纳斯达克道西赖特动量+低波动指数 ETF 股票历史数据集

2025年5月27日 30 20 9

数据概述：本数据集提供了特定公司的历史股票市场表现数据。它包含了公司股票价格随时间推移的变化信息，使得用户能够分析和理解股票价格的过往趋势和波动情况。数据用途概述：...

zip

电磁干扰数据集：用于 EMI 信号分类的数据集

2025年2月14日 160 16 10

该数据集是为分类任务设计的电磁干扰 (EMI) 信号和正常（未受影响）信号的集合，每个信号由 4000 个时间步长组成。幅度以毫伏 (mV) 表示。它包括 8 个不同类别的 EMI 信号和正常信号，代表电气状况和故障（总共 9 个类别）。特征表示为原始信号值，捕捉 EMI...

zip

ECI印度议会选举候选人详情数据集

2025年5月17日 30 21 8

数据概述：本数据集包含了印度大选中每个选区中每位候选人的详细信息。数据记录了历届印度大选中候选人的基本信息、选票数量、选举结果等关键数据。所有数据均直接来源于印度选举委员会（ECI）官方网站，未经任何计算处理，确保了数据的原始性和准确性。对于部分数据，提供了参考链接，用户可通过直接访问或使用Wayback Machine进行核查。数据用途概述：...

zip

DUTS 大规模图像显著性检测基准数据集

2025年2月13日 179 26 6

DUTS 是一个大规模显著性检测数据集，包含 10,553 张训练图像和 5,019 张测试图像。所有训练图像均来自ImageNet DET 训练/验证集，而测试图像则来自 ImageNet DET 测试集和SUN 数据集。训练集和测试集都包含对显著性检测非常具有挑战性的场景。精确的像素级基本事实由 50 名受试者手动注释。

zip

商业智能和数据可视化 Domo 美股历史数据集

2025年5月18日 30 23 9

数据概述：本数据集提供了特定公司的历史股票市场表现数据。它包含了股票价格随时间推移的变化信息，允许用户分析和理解股票价格的历史趋势和波动情况。数据通常包括每日或更短时间间隔的股票价格、交易量等关键指标。数据用途概述：...

zip

MultiWOZ (Multi-domain Wizard-of-Oz)

2024年11月10日 90 12 10

Multi-Domain Wizard-of-Oz 数据集 (MultiWOZ)，一个完全标记的人类与人类书面对话的集合，跨越多个领域和主题。在 10k 个对话的大小上，它至少比以前所有带注释的面向任务的语料库大一个数量级。

zip

美国软件公司_GenDigtal_历史股票数据集

2025年6月21日 30 13 3

数据概述：本数据集提供了特定公司股票的历史市场表现数据。它包含了股票价格随时间变化的详细信息，如开盘价、收盘价、最高价、最低价和交易量等关键指标。这些数据通常按日或更短的时间间隔记录，为用户提供了分析股票价格随时间推移的趋势和波动的基础。数据涵盖了特定公司的股票交易记录，是研究公司股票表现的重要资料。数据用途概述：...

zip

找到265个数据集

注册成功！