数据集 - 海数据

海南自由贸易港新办ICP资料数据

2024年11月5日

数据名称：海南自由贸易港新办ICP所需资料数据数据范围：自贸港新办ICP所需资料数据时间：截止2024年数据说明：自贸港新办ICP需准备资料清单；相关承诺书模版等全套资料。

RAR

可穿戴传感器动作分析数据集

2024年11月9日

该数据集旨在使用从可穿戴传感器收集的数据，在人机交互 (HCI) 环境中进行动作分类，并与动画设计的仿生视觉系统相结合。该数据集是作为一项研究的一部分收集的，该研究旨在改善实时人体动作识别，以增强虚拟现实 (VR) 和增强现实 (AR) 环境中的沉浸式体验。参与者：数据来自 30 名参与者（15 名男性和 15...

text/csv

垃圾短信垃圾邮件收集数据集

2024年11月9日

从 Grumbletext 网站手动提取了 425 条垃圾短信。这是一个英国论坛，手机用户在此公开声明垃圾短信，但大多数用户并未报告收到的垃圾短信。 NUS SMS Corpus (NSC) 的 3,375 条随机选择的 SMS 短信子集，该数据集包含约 10,000...

text/csv

加拿大温尼伯的光学雷达融合农田测绘

2024年11月9日

该数据集是“使用融合光学雷达数据集进行作物测绘”的副本，由 Iman Khosravi 博士（伊朗德黑兰大学地理学院遥感与 GIS 系）创建,它包含用于农田分类的融合双时态光学雷达数据，以表格形式显示，这些数据来自 RapidEye 卫星（光学）收集的图像和无人机合成孔径雷达（UAVSAR）于 2012 年 7 月 5 日和 7 月 14...

text/plain

家庭用电研究数据

2024年11月9日

该数据集包含近四年来某个家庭用电量的详细测量数据。该数据以一分钟的采样率收集，可深入了解该家庭的各种电量和分表值。该数据集包含 2,075,259 个观测值，涵盖 2006 年 12 月至 2010 年 11 月期间的数据。...

text/csv

空间材料结构优化数据集

2024年11月9日

此文件夹包含使用 top88 算法进行拓扑优化 (TO) 生成的数据。top88 算法有助于根据给定的体积分数优化设计空间内的材料分布，旨在实现结构最优设计。

RAR

纳米粒子电子结构数据集

2024年11月9日

atom_count：每个纳米粒子中的原子数，范围从 19 到 140。 structure_type：纳米粒子结构类型，随机分配为“立方八面体”、“二十面体”或“立方体”。 atomic_number：表示元素的原子序数，主要选择贵金属的典型值（例如，Pt 为 78，Au 为 79）。电负性：代表金属元素的合成电负性值介于 2.0 和 3.0...

text/csv

全球IP地址库数据集

2024年11月10日

全球IP地址是由Internet Assigned Numbers Authority (IANA)负责管理和分配的，IANA将IP地址分配给区域互联网注册机构（RIRs），由它们进一步分配给各个国家、地区或互联网服务提供商（ISPs）。 1. IPv4地址和IPv6地址 IPv4：IPv4地址是32位的，分为4组，每组8位，用“.”分隔，例如...

text/plain

OpenFinData开源金融评测数据集

2024年11月10日

OpenFinData是由东方财富与上海人工智能实验室联合发布的开源金融评测数据集。该数据集代表了最真实的产业场景需求，是目前场景最全、专业性最深的金融评测数据集。它基于东方财富实际金融业务的多样化丰富场景，旨在为金融科技领域的研究者和开发者提供一个高质量的数据资源。

application/zip

OCNLI中文自然语言训练数据集

2024年11月10日

OCNLI代表原始中文自然语言推论。它是中文自然语言推理的语料库，紧密按照MNLI的程序收集，但具有增强的策略，旨在实现更具挑战性的推理对。我们想强调的是，我们在创建数据集时没有使用人机翻译，因此我们的中文文本是原创的，没有翻译。

RAR

ETT (Electricity Transformer Temperature)

2024年11月10日

电力变压器温度 (ETT) 是电力长期部署的关键指标。该数据集由来自中国两个分离县的2年数据组成。为了探索长序列时间序列预测 (LSTF) 问题的粒度，创建了不同的子集，{ETTh1，ETTh2} 为1小时级，ETTm1为15分钟级。每个数据点由目标值 “油温” 和6个功率负载特征组成。火车/val/测试为12/4/4个月。

GZ

SST (Stanford Sentiment Treebank)

2024年11月10日

斯坦福情感库是一个带有完全标记的解析树的语料库，可以全面分析情感在语言中的构成影响。该语料库基于 Pang 和 Lee (2005) 引入的数据集，由从电影评论中提取的 11,855 个单句组成。它使用斯坦福解析器进行解析，包括来自这些解析树的总共 215,154 个独特的短语，每个短语由 3...