-
冒犯性语言文本数据集(英文)
数据以CSV格式和pickled pandas数据框(Python 2.7)存储。 count = 编码每条推文的CrowdFlower用户数量(最小值为3,有时当CF判断推文不可靠时,会有更多用户编码一条推文)。 hate_speech = 判断推文为仇恨言论的CF用户数量。 offensive_language =...
-
由富及贵——带你打入精英圈音频课程合集
由富及贵——带你打入精英圈音频课程合集 数据的内容: 本数据集包含由胡润发布的《由富及贵——带你打入精英圈》系列音频课程,共20个章节,涵盖贵族教育、财富管理、生活方式、婚姻观、消费观、修养与追求、健康生活等多个方面,旨在帮助听众深入了解和融入精英圈层。 数据来源: 互联网公开数据 行业用途划分: 教育行业: 作为贵族教育和精英培养的教材资源。...
-
利用机器学习进行简历筛选数据集
为一个职位筛选数千份简历。对于劳动密集型、正在增长或高流失率的企业来说,这项任务更具挑战性。聘用合适的人才至关重要,但当申请人数之巨超出传统招聘流程的承受能力时,招聘难度就会加大。这时简历筛选就派上用场了,这是从众多简历中找出合格候选人的重要步骤。
-
-
金砖国家经济指标预测模型
该模型采用多项式回归方法和随机梯度下降 (SGD) 来预测金砖国家的经济指标。该模型利用多项式特征来捕获数据中的非线性关系,并利用 SGD 进行优化。它是在 1970 年至 2020 年的经济指标数据集上进行训练的,重点关注政府消费支出等指标。 “我已经进行了一项统计研究,发现 1970 年至 1986...
-
-
混凝土抗压测试数据集
此数据集模拟混凝土混合物成分及其相关的环境影响。它旨在研究和预测混凝土的抗压强度,同时考虑可持续性标准,包括体现的二氧化碳排放、能源消耗和资源消耗。目标是提供见解,以优化混凝土混合物,实现高性能和环境可持续性。
-
国家基本医疗保险、工伤保险和生育保险 药品目录(2023 年)
《国家基本医疗保险、工伤保险和生育保险药品目录》 (简称《药品目录》)是基本医疗保险和生育保险基金支付 药品费用的标准。临床医师根据病情开具处方、参保人员购 买与使用药品不受《药品目录》的限制。工伤保险基金支付 药品费用范围参照本目录执行。 凡例是对《药品目录》中药品的分类与编号、名称与剂 型、备注等内容的解释和说明,是《药品目录》的组成部分,...
-
国际数学奥林匹克 (IMO) 数据
国际数学奥林匹克 (IMO) 是针对高中生的世界数学锦标赛,每年在不同的国家举行。第一届 IMO 于 1959 年在罗马尼亚举行,共有 7 个国家参赛。它逐渐扩展到来自五大洲的 100 多个国家。比赛由 6 道题组成,连续两天举行,每道题 3 道。 随着时间的推移,国家排名如何变化? 参与人数的性别分布如何?最高分的分布如何?...
-
供应链成本优化数据集
该数据集专为供应链优化问题而设计,其目标是在满足客户需求的同时最小化总运输和库存成本。该数据集包含有关多个供应商、客户、运输成本和其他物流相关参数的信息。 供应商:此数据集包含五个供应商(供应商 1 至供应商 5)。每个供应商都有特定的供应能力和相关成本。客户:六个客户(客户 1 至客户 6)有特定需求要求,需要供应商满足。...
-
工厂工人的日常表现和流失关系数据集
该合成数据集包含一家工厂 18 个月的日常绩效和人员流失数据(411,948 个观测值),该工厂的组织结构由 508 名工人组成。由于员工流动,数据集中总共出现了 687...
-
根据人口统计数据预测度假偏好的数据集
该数据集旨在分析公众对两种热门度假类型(山脉和海滩)的偏好。它深入了解了可能影响这些偏好的各种人口和生活方式因素。通过探索此数据集,用户可以应用多种机器学习技术来根据个人属性预测他们更喜欢山脉还是海滩。
-
福布斯最适合居住工作和旅游的 100 个城市2021-2024
2020 年 1 月 1 日至 2024 年 10 月 27 日福布斯最适合居住、工作和旅游的 100 个城市的每小时和每日天气数据集
-
菲律宾PC配件数据集
item_id - 商品 ID item_sku - 商品 SKU item_name - 商品名称 brand_name - 商品品牌 category_name - 商品类别 item_price_in_php - 数据提取时菲律宾比索的价格 stocks - 数据提取时的股票数量 promo1 - 商品促销 1(如果有) promo2 - 促销...
-
德国TOP 12 公司财务数据
该数据集包含 12 家德国大公司的财务记录,包括大众汽车集团、西门子集团、安联集团、宝马集团、巴斯夫集团、德国电信集团、戴姆勒集团、SAP 集团、拜耳集团、德意志银行集团、保时捷集团和默克集团等顶级公司。 该数据集涵盖 2017 年至 2024 年的季度数据,旨在提供对关键财务指标的洞察,从而对企业财务状况、绩效和增长趋势进行深入分析和建模。...
-
大气中一氧化二氮浓度2002-2024
该数据集提供了2002年至2024年全球大气中一氧化二氮浓度的全面信息。它为研究人员和气候科学家提供了分析温室气体水平长期趋势的宝贵资源,有助于气候变化研究和环境政策制定。 该数据集的主要特征包括: 覆盖范围广泛,跨越二十年(2002-2024) 每个数据点的 5 个关键属性,包括平均浓度和趋势 每月分辨率的详细时间分析 平均值和趋势值的不确定性度量...
-
超级英雄力量分析
该数据集提供了来自不同漫画世界的 675 位超级英雄和反派的详细信息。它包括各种属性,例如力量统计数据、传记信息、外貌和从属关系。数据是使用 SuperHero API 收集的,为研究人员和数据爱好者提供了丰富的资源,可用于分析、机器学习项目和漫画人物研究。 全面涵盖 675 个漫画人物 每个角色有 26 种属性,包括力量统计、传记和外观,以及...
-
比特币一年数据集2023-2024
“该数据集包含一年内比特币的价格数据,以 12 小时为间隔进行记录。每个数据点代表特定时间的比特币价格,提供近 365 天的市场行为快照。该数据集捕捉了基本的价格波动,使其成为趋势分析、回溯测试策略和探索长期市场模式的理想选择。凭借其一致的时间间隔和简单的结构(时间戳和价格),它为统计分析和预测建模提供了坚实的基础。”
-
巴以贸易敌对行为数据集
与全球贸易讨论相反,巴勒斯坦国的情况凸显了另一种形式的危机——冲突和灾难导致的国内流离失所。由于该地区的不稳定和持续的冲突,巴勒斯坦国的冲突和灾难引起的人口流动或“流动”受到密切监控。最新数据涵盖了 180 天的时间,可以深入了解这些流离失所的规模和频率。



