找到254个数据集

格式: zip

过滤结果
  • 罗斯科学文章/Рус научные статьи

    2025年2月14日 318 25 4

    从 eLibrary.ru 网站下载了 2,478 篇俄语科学文章,这些文章被分为顶级 GRNTI(国家科学技术信息分类表)的 62 个标题。eLibrary.ru。网站上的期刊目录包含 71 个 GRNTI 类别,我选择了其中有足够数量的科学期刊和文章属于公共领域的类别。 标题位于说明的末尾。 下载了 pdf 文件,将其转换为 txt...
    packageimg
  • 威瑟斯系统公司-vs-历史股票数据集

    2025年5月27日 30 23 3

    数据概述: 本数据集提供了特定公司股票的历史市场表现数据。该数据涵盖了股票价格随时间推移的变化情况,使使用者能够分析和理解股票价格的历史趋势和波动。数据通常包括股票的开盘价、收盘价、最高价、最低价、成交量等关键指标,并以时间序列的形式呈现。 数据用途概述:...
    packageimg
  • Valorant VCT 电子竞技数据

    2024年12月24日 30 18 9

    数据是从 YouTube 上保存的 VCT(2023)数据的视频帧中手动收集的。使用 Tesseract OCR 将字幕转换为文本,并使用经过标记的枪支/盾牌图像训练的 Tensorflow CNN 确定枪支/盾牌。
    packageimg
  • Udacity 自动驾驶汽车数据集:用于自动驾驶物体检测的重新标记和增强

    2025年2月13日 428 19 2

    Udacity 自动驾驶汽车 > 固定小”数据集是经过精心策划和重新标记的图像集合,专为自动驾驶应用中的对象检测任务而设计。它通过纠正行人、骑自行车的人、车辆和交通灯等关键对象的缺失标签来解决原始 Udacity 数据集的缺点。该数据集包含 15,000 张高分辨率图像 (1920x1200) 和跨越 11 个类别的总共 97,942...
    packageimg
  • 揭开社交媒体的情感面纱:Twitter 情感数据集

    2025年2月13日 378 16 8

    利用我们精心整理的数据集,深入了解通过 Twitter 消息表达的人类情感的复杂世界。这个综合集合中的每个条目都包含从 Twitter 中提取的一段文本,并附有相应的标签,表示消息传达的主要情感。情绪被精心分为六个不同的类别:悲伤 (0)、快乐 (1)、爱 (2)、愤怒 (3)、恐惧 (4) 和惊讶 (5)。...
    packageimg
  • 美国提普特里公司-TIPT-历史股票数据集

    2025年6月18日 30 23 9

    数据概述: 本数据集提供了特定公司的历史股票市场表现数据。它包含了公司股票在一段时间内的价格、交易量等关键信息,使得用户能够分析和理解股票价格随时间推移的变化趋势和波动情况。 数据用途概述:...
    packageimg
  • 美股TG治疗公司-TGTX 历史股票数据集

    2025年6月16日 30 27 10

    数据概述: 本数据集提供了特定公司的历史股票市场表现数据。它包含了公司股票价格随时间推移的详细记录,使得用户可以分析和理解股票价格在过去一段时间内的趋势和波动。数据通常包括开盘价、收盘价、最高价、最低价、交易量等关键指标,并按时间序列排列。 数据用途概述:...
    packageimg
  • 泰创电子元件公司-TAIT 历史股票数据集

    2025年6月14日 30 30 6

    数据集说明: 本数据集记录了美国上市公司TAIT(Taitron Components Incorporated)在1995年4月至1997年6月期间的每日股票交易行情。每条记录表示一个交易日的市场指标,包括开盘价、最高价、最低价、收盘价、复权收盘价及交易量。 字段定义: open:开盘价,当日市场开始交易时的价格...
    packageimg
  • Spotify-YouTube音乐表现综合数据集

    2025年8月21日 30 20 10

    数据集概述 本数据集整合了世界各地不同艺术家歌曲在Spotify和YouTube两大平台的综合统计信息。数据集涵盖20,718首歌曲,包含艺术家信息、音轨特征、专辑详情以及跨平台表现数据,为音乐行业分析、流媒体研究和商业决策提供了丰富的数据基础。 数据字段定义 基础信息字段: Artist:艺术家名称 Track:歌曲名称 Album:专辑名称...
    packageimg
  • 肥胖治疗的创新医疗器械公司ReShape历史股票数据集

    2025年5月5日 30 18 2

    数据概述: 本数据集提供了特定公司股票的历史市场表现数据。数据涵盖了股票价格随时间推移的变动情况,包括开盘价、收盘价、最高价、最低价、成交量等关键指标。通过这些数据,用户可以深入了解股票价格的历史趋势和波动情况。 数据用途概述:...
    packageimg
  • Slovo:俄罗斯手语(RSL)识别的视频数据集

    2025年2月13日 200 25 7

    Slovo - 俄罗斯手语数据集 我们引入了一个用于俄罗斯手语任务的大规模视频数据集Slovo。Slovo数据集大小约为16 GB,包含来自 194 位歌手的1000 个手语手势的20400 个RGB 视频。每类有 20 个样本。数据集按主题分为训练集和测试集。训练集包括 15300 个视频,测试集包括 5100 个视频。总视频录制时间约为 9.2...
    packageimg
  • PyTorch 几何外部库

    2025年2月13日 190 24 8

    用于 Kaggle Env 的 PyTorch 几何外部库轮子 该数据集是 PyTorch Geometric外部库的 Python wheel 包文件(只需安装PyG即可) 。PyTorch pip install torch_geometricGeometric 是用于构建图神经网络的 torch...
    packageimg
  • PCB 缺陷数据集(带有 YOLO 注释)

    2025年2月13日 200 15 4

    内容 数据集中定义的缺陷有:缺孔、鼠咬、断路、短路、毛刺、杂散铜。北京大学人机交互开放实验室发布了PCB缺陷数据集。扩充后的数据集包含10668张图片和相应的标注文件。 致谢 R. Ding、L. Dai、G. Li 和 H. Liu,“TDD-net:用于印刷电路板的微型缺陷检测网络”,载于《CAAI 智能技术学报》,第 4 卷,第 2 期,第...
    packageimg
  • NLp专用短信垃圾邮件分类数据集

    2025年5月13日 30 26 10

    数据概述: 本数据集是一个短信垃圾邮件收集数据集,包含超过10,000条SMS短信消息,并已被标记为“垃圾邮件”(spam)或“非垃圾邮件”(ham)。数据集中的每条短信以文本字符串的形式呈现。 数据包含以下字段: text:表示每条短信的内容。 target:指示每条短信是“垃圾邮件”还是“非垃圾邮件”。 数据用途概述:...
    packageimg
  • 用于 NLP 任务的高质量金融新闻数据集

    2025年2月13日 367 16 1

    此存储库包含从各个金融网站精心抓取的数据集。数据提取过程可确保文本高质量且准确,包括网站及其嵌入 PDF 的内容。 数据集特征 日期: 公告日期。 主题:财经新闻的主题。 内容:公告的全部内容,包括网站文本和 PDF。 附加处理字段 我们应用先进的 Mixtral 7X8 模型来生成以下附加字段:...
    packageimg
  • 微策略公司 MSTR历史数据分析数据集

    2025年6月13日 30 28 5

    数据概述: 本数据集提供了特定公司股票市场的历史表现数据。它包含了股票价格随时间推移的变动信息,使用户能够分析和理解股票价格的过去趋势和波动情况。数据通常涵盖了股票的开盘价、收盘价、最高价、最低价、成交量等关键指标,并按时间序列组织。 数据用途概述:...
    packageimg
  • 中风患者的全头部 MRI 和分割

    2025年2月10日 300 19 7

    使用手动标记技术对全头部进行分割 A. 慢性异常患者和健康受试者的头部 MRI 数据来自 3 个不同机构,来自不同临床状况的患者。所有扫描均为 T1 加权 MRI,共 54 人,具体如下:4 人为健康受试者(性别:4 男/0 女,种族:1 亚裔,3 白人(非拉丁裔),年龄:30-50 岁)的扫描,采用 3T Siemens Trio...
    packageimg
  • 欧洲酒店客户预订需求行为数据集-moonlightkim

    2025年5月19日 30 20 9

    数据概述: 本数据集收集了两类酒店(城市酒店与度假酒店)的预订行为数据,涵盖了客户预订时间、入住时长、随行人数、停车需求等多个维度。数据可用于分析客户预订习惯、预测入住需求、评估取消率等。所有涉及个人身份的信息均已删除,确保数据可公开使用。数据源来自经同行评审的研究文章,具备较高的研究参考价值。 字段说明(常见字段包括但不限于):...
    packageimg
  • MathQA

    2024年11月10日 30 24 10

    本数据集是通过使用一种新的表示语言对 AQuA-RAT 数据集进行注释来收集的。 AQuA-RAT 提供了问题、选项、理由和正确选项。
    packageimg
  • 使用 peft 和 lora 进行 LLM 微调的合成数据

    2025年2月14日 200 14 9

    该数据集包含对话摘要、主题和对话,用于使用参数有效微调和大型语言模型的低秩自适应创建对 LLM 模型进行微调的管道,这是一种流行且轻量级的训练技术,可显着减少可训练参数的数量。 该数据集也可在 hugging face 中使用。https://huggingface.co/datasets/knkarthick/dialogsum
    packageimg