找到90,617个数据集

标签: CSV

过滤结果
  • 冒犯性语言文本数据集(英文)

    2024年11月9日   

    数据以CSV格式和pickled pandas数据框(Python 2.7)存储。 count = 编码每条推文的CrowdFlower用户数量(最小值为3,有时当CF判断推文不可靠时,会有更多用户编码一条推文)。 hate_speech = 判断推文为仇恨言论的CF用户数量。 offensive_language =...
    packageimg
  • 快速消费品销售需求预测与优化FMCG

    2024年11月9日   

    该数据集提供了 1000 行各种快速消费品 (FMCG)...
    packageimg
  • 咖啡订单数据集

    2024年11月9日   

    订单销售数据集通常包含来自咖啡店的交易数据,包括有关所售产品、销售模式和客户偏好的信息。
    packageimg
  • 菲律宾PC配件数据集

    2024年11月9日   

    item_id - 商品 ID item_sku - 商品 SKU item_name - 商品名称 brand_name - 商品品牌 category_name - 商品类别 item_price_in_php - 数据提取时菲律宾比索的价格 stocks - 数据提取时的股票数量 promo1 - 商品促销 1(如果有) promo2 - 促销...
    packageimg
  • 德国TOP 12 公司财务数据

    2024年11月9日   

    该数据集包含 12 家德国大公司的财务记录,包括大众汽车集团、西门子集团、安联集团、宝马集团、巴斯夫集团、德国电信集团、戴姆勒集团、SAP 集团、拜耳集团、德意志银行集团、保时捷集团和默克集团等顶级公司。 该数据集涵盖 2017 年至 2024 年的季度数据,旨在提供对关键财务指标的洞察,从而对企业财务状况、绩效和增长趋势进行深入分析和建模。...
    packageimg
  • 蛋白质RNA文本数据集

    2024年11月9日   

    该数据集包含从 Wikipedia API 中提取的科学文本,重点关注与 RNA 和蛋白质相关的主题。它有两个 CSV 文件:一个是葡萄牙语,另一个是英语。该项目的目标是探索使用语言模型 (LLM) 和快速工程技术来识别与可能成为药物或疫苗开发潜在候选物的蛋白质相关的关键词。此外,该数据集可用于机器学习方法,使用...
    packageimg
  • 超级英雄力量分析

    2024年11月9日   

    该数据集提供了来自不同漫画世界的 675 位超级英雄和反派的详细信息。它包括各种属性,例如力量统计数据、传记信息、外貌和从属关系。数据是使用 SuperHero API 收集的,为研究人员和数据爱好者提供了丰富的资源,可用于分析、机器学习项目和漫画人物研究。 全面涵盖 675 个漫画人物 每个角色有 26 种属性,包括力量统计、传记和外观,以及...
    packageimg
  • 比特币一年数据集2023-2024

    2024年11月9日   

    “该数据集包含一年内比特币的价格数据,以 12 小时为间隔进行记录。每个数据点代表特定时间的比特币价格,提供近 365 天的市场行为快照。该数据集捕捉了基本的价格波动,使其成为趋势分析、回溯测试策略和探索长期市场模式的理想选择。凭借其一致的时间间隔和简单的结构(时间戳和价格),它为统计分析和预测建模提供了坚实的基础。”
    packageimg
  • 巴西旷工因素分析数据

    2024年11月9日   

    该数据库是根据巴西一家快递公司 2007 年 7 月至 2010 年 7 月的缺勤记录创建的。 实例数:740 属性数量:21 缺失值:0
    packageimg
  • UCI空气质量数据集

    2024年11月9日   

    该数据集包含几个月来收集的全面空气质量测量数据,重点关注各种污染物。它旨在用于环境科学和公共卫生领域的预测建模和数据分析。这些数据提供了有关不同气体浓度水平的宝贵见解,使其适用于机器学习应用中的回归和分类任务。 Date 测量日期。 Time 测量时间。 CO(GT) 空气中一氧化碳(CO)的浓度,单位为微克每立方米 (µg/m³)。...
    packageimg
  • Solana 历史数据 2021 - 2024

    2024年11月9日   

    该数据集包括 2021 年 1 月 1 日至 2024 年 9 月 29 日 Solana (SOL) 的每日价格和交易量数据。 数据包括用于分析 Solana 随时间的表现和趋势的基本交易指标。这些指标可用于预测、交易策略或其他财务分析。
    packageimg
  • Meta 的历史股票数据2000-2024

    2024年11月9日   

    这是 2000 年至 2024 年(10 月)的 Meta 股票数据 日期:记录的日期(YYYY-MM-DD)。 开盘价:股票的开盘价。 最高价:当日股票的最高价格。 最低价:当日股票最低价。 收盘价:股票的收盘价。 调整收盘价:调整后的收盘价。 交易量:交易的股票数量。
    packageimg
  • HLTV 比赛结果CS2

    2024年11月9日   

    team_won:赢得比赛的队伍名称。例如,值可能包括 paiN、ALTERNATE aTTaX 等。 team_lost:比赛失败的队伍名称。例如,值可能包括 RED Canids、Case 等。 stars_of_tournament:锦标赛的重要性级别,以星级或其他评级格式表示。值越高,锦标赛越有声望。通常,值的范围是 0 到 5。...
    packageimg
  • geoleaderboard 排行榜数据

    2024年11月9日   

    该数据集为geoleaderboard 网站提供全面的排行榜数据,每日更新。它包括排名、用户名、国家、评级、分区、移动评级、无移动评级和 NMPZ 评级等列。非常适合跟踪玩家表现并分析 GeoGuessr 游戏中的模式。
    packageimg
  • 福布斯全球亿万富翁综合数据集2024

    2024年11月8日   

    这份全面的数据集囊括了《福布斯》 2024 年列出的全球最富有人士的详细概况。该数据集通过细致的网络抓取和数据聚合编制而成,包含每位亿万富翁的广泛属性。字段包括姓名、年龄和性别等基本个人信息,以及包括净资产和财富来源在内的财务详细信息。该数据集进一步深入研究了行业参与、组织隶属关系、慈善事业和教育背景等方面。...
    packageimg
  • Crunchbase独角兽详情数据集

    2024年11月8日   

    该数据集基于 Crunchbase 独角兽和新兴独角兽名单。 独角兽数据集包括投资后估值 10 亿美元或以上的私人独角兽公司,基于 Crunchbase 数据。 根据 Crunchbase 的数据,新兴独角兽包括估值 5 亿美元或以上但低于 10 亿美元的私营公司。
    packageimg
  • 全球财富500 强企业数据集2024

    2024年11月8日   

    该数据集提供了对 2024 年财富全球 500 强公司的详细见解。它包括排名、公司名称、收入、收入变化百分比、利润、资产、利润变化百分比和员工人数等重要指标。 这一丰富的数据集让我们得以一窥全球商业格局的演变,突显出企业如何适应新兴挑战和机遇。分析师可以利用这些数据来分析企业战略、确定增长领域,并根据历史表现预测市场趋势。...
    packageimg
  • NVDA 股票数据集2024-9-分钟

    2024年11月8日   

    财务数据是使用 yfinance 库获取的。情绪数据是通过抓取 Yahoo Finance 收集的,分数由 finBERT 提供。新闻每分钟抓取一次,时间为东部时间。程序停止抓取时发布的任何新闻文章都会在程序重新启动时添加,此时仍处于第二天上午 6:00 的市场营业时间之前。收盘价列应该是模型中的目标变量。
    packageimg
  • 多种健身锻炼数据集

    2024年11月8日   

    该数据集提供了 50 种旨在促进整体健康和健身的各种锻炼的详细信息。它包括适合初学者到高级健身爱好者的各种活动,针对不同的肌肉群和健身目标。这些数据可用于个人健身计划、锻炼应用开发或健康和运动科学的数据分析项目。 锻炼名称:锻炼的通用名称。 类型:字符串 描述:数据集中每个锻炼的唯一标识符。 组数:建议练习的组数。 类型:整数...
    packageimg
  • 华盛顿免税车辆统计数据集

    2024年11月8日   

    数据用途简介:该数据集可用于多方面的分析与应用。政府部门可以通过分析符合税收豁免的电动汽车车型,评估政策的实施效果,识别政策执行中的问题,并据此优化政策设计。...
    packageimg