-
罗斯科学文章/Рус научные статьи
从 eLibrary.ru 网站下载了 2,478 篇俄语科学文章,这些文章被分为顶级 GRNTI(国家科学技术信息分类表)的 62 个标题。eLibrary.ru。网站上的期刊目录包含 71 个 GRNTI 类别,我选择了其中有足够数量的科学期刊和文章属于公共领域的类别。 标题位于说明的末尾。 下载了 pdf 文件,将其转换为 txt...
-
包含“绿色氢”文章标题的数据集
该数据集包含从 CNBC 和 Google RSS 网站抓取的数据 - 其中包含“绿色氢”的文章标题。此外,还包含日期、文章所涉及的组织名称及其情感分数,可用于比较每篇文章。
-
建立团队的分析方法:原神角色列表 5.2 版
该数据集包含《原神》5.2 版以来的所有角色 创建此数据集是为了让像我这样的有抱负的数据分析师能够以独特而有趣的方式练习处理数据。下载数据集的用户可以练习使用数据可视化,并在玩《原神》时根据自己的需求快速访问角色信息。
-
用于 NLP 任务的高质量金融新闻数据集
此存储库包含从各个金融网站精心抓取的数据集。数据提取过程可确保文本高质量且准确,包括网站及其嵌入 PDF 的内容。 数据集特征 日期: 公告日期。 主题:财经新闻的主题。 内容:公告的全部内容,包括网站文本和 PDF。 附加处理字段 我们应用先进的 Mixtral 7X8 模型来生成以下附加字段:...
-
全球陆地的视觉探索:国家实际面积数据集
该数据集提供了各国及其各自陆地和水域面积的综合列表。它包括墨卡托投影所描绘的国家大小与其真实地理比例的详细比较。该数据集的灵感来自传统地图投影的局限性,旨在更准确地表示全球陆地。 一个 CSV 文件,包含国家列表、其陆地面积、水域面积、总面积和水域面积百分比。
-
美国调查和蜜蜂数量普查数据
该数据集提供了对美国农业部国家农业统计局快速统计数据集捕获的丰富而广泛的蜜蜂群落贡献信息的访问。在这里,您可以找到按州划分的调查数据和按县划分的人口普查数据,这些数据有助于为与养蜂实践相关的决策和研究提供信息。 关于此文件 建议编辑 该文件包含冬季期间损失的蜂群总数、各州养蜂人和蜂群数量以及各州独有的养蜂人和蜂群数量的数据...
-
geoleaderboard 网站上使用的排行榜数据
该数据集为geoleaderboard 网站提供全面的排行榜数据,每日更新。它包括排名、用户名、国家、评级、分区、移动评级、无移动评级和 NMPZ 评级等列。非常适合跟踪玩家表现并分析 GeoGuessr 游戏中的模式。
-
核聚变实验的模拟数据
核能聚变实验的模拟数据集对于对核聚变领域感兴趣的研究人员和爱好者来说都是宝贵的资源。该数据集由 100,000 行组成,每行代表一个实验,并包含各种对于了解聚变反应成功或失败至关重要的参数。这些参数包括燃料密度、温度、约束时间、燃料纯度、能量输入、功率输出、压力和中子产量等。...
-
NIH 平衡胸部 X 光检查
将高度不平衡的数据集转换为具有 1024x1024 图像的平衡数据集 关于此文件 标签的独热编码格式 小路 肺不张 心脏扩大 合并 浮肿 积液 气肿 纤维化 疝 浸润 大量的 未发现 结核 胸膜增厚 肺炎 气胸
-
材料寿命预测数据集
该数据集包含用于预测工业部件所用材料寿命(以小时为单位)的模拟数据。它包括与材料成分、制造工艺和结构缺陷相关的各种特征。该数据集非常适合探索回归技术、特征工程和材料科学应用。 列 PredictedHours:代表预测寿命(以小时为单位)的目标变量。 ComponentType:组件的类型(例如喷嘴、叶片、块体)。...
-
-
英国 36 个站点的历史气象站数据
英国气象局自 1854 年成立以来一直负责监测英国天气。英国有 36 个气象站(通常位于皇家空军基地)收集信息,用于预测未来天气模式并发布公共建议。最近,这些大型数据集已成为调查英国气候在过去 150 多年中如何变化的有用工具。 内容 列: year:进行测量的年份 month:进行测量的月份 tmax:平均每日最高气温(℃)...
-
ESG Ratings and Stock Data for Dow 30 Companies
该数据集可帮助您比较截至 2024 年 6 月道琼斯 30 指数公司的来自 4 家不同 ESG 提供商(包括 ESGAnalytics.io、Sustainalytics、S&P Global 和 MSCI)的 ESG 评级和股票市场信息。 Unique_id 从 ESGAnalytics.io 中提取所跟踪公司的唯一 ID 象征...
-
狗牌照数据集:纽约市有效狗证
根据法律规定,居住在纽约市的所有狗主人都必须为他们的狗办理许可证。数据来源于 DOHMH 狗许可证系统,狗主人可以在此申请和续签狗许可证。 每条记录代表了该年内有效的唯一狗执照,但不一定是每只狗的唯一记录,因为在年内续签的执照会产生有效执照期限的单独记录。每条记录代表了该只狗在一年的时间范围内的一个唯一执照期限。...
-
自适应信号中继数据集
该数据集提供了有关部署在山区的网络节点的全面详细信息,重点关注其 GPS 位置、能量特性、信号性能以及在网络中的作用。它包含 5000 行,每行代表一个独特的网络节点及其相关属性。该数据集旨在分析和优化无线通信系统,特别是在山区等具有挑战性的环境中。 主要特点: Node_ID:每个网络节点的唯一标识符。GPS_Latitude...
-
乳腺癌预测
数据集信息: 特征是根据乳腺肿块细针抽吸物 (FNA) 的数字化图像计算得出的。这些特征描述了细胞核的特征。 上述分离平面是使用多表面方法树 (MSM-T) [KP Bennett,“通过线性规划构建决策树”。第四届中西部人工智能和认知科学学会论文集,第 97-101 页,1992] 获得的,这是一种使用线性规划构建决策树的分类方法。相关特征是在...
-
507 名身体活跃人士的身体测量数据
关于数据集 给出了 507 名身体活跃人士(247 名男性和 260 名女性)的周长和骨骼直径测量值以及年龄、体重、身高和性别。这些数据可用于为统计学学生提供数据分析方面的练习。此类分析范围从简单的描述性显示到更复杂的多变量分析,例如多元回归和判别分析。 数据 bia_di 一个数值向量,受访者的双肩峰直径(以厘米为单位)。 bii_di...
-
2010 年至 2023 年雅加达每日空气质量指数 (AQI)
该数据集包含 2010 年至 2023 年期间雅加达特区 5 个空气质量监测站 (SPKU) 测得的空气质量指数 (AQI) 或空气质量标准指数 (ISPU)。 文件描述 在此数据集中,有两种类型的文件: ispu_dki x:此文件代表每个监测站的 AQI 测量结果。“x”是站点序列号。此文件包含从2010 年到 2021 年的测量结果。...
-
菲律宾地震(来自菲律宾地震研究所)2016-2025
该研究所的国家地震监测和信息旨在提供可能对菲律宾产生重大影响的重大地震和海啸事件的准确和及时的信息;并确保地震数据的可访问性和完整性。随着九十二 (92) 个地震网络的运行,该国的地震监测得到了加强,其中十 (10) 个地震台站于 2016 年投入使用。菲律宾地震和地震部在 2010 年拥有 64 个台站,并超额完成了到 2016 年底建立 85...
-
印度次大陆发生的自然灾害(1990 - 2021 年)
印度的地理环境极其多样,从北部的雪山到南部的沿海平原,还有茂密的雨林和塔尔沙漠。除此之外,印度还是世界第二大人口大国(13亿人)。这种多样性带来了许多不同的自然灾害,从洪水、地震到飓风和龙卷风。更糟糕的是,由于人口众多,各种疾病传播得非常快。 该数据集包含 1990 年至 2021 年印度发生的所有灾难及其信息。 内容...



