-
海南自由贸易港新办ICP资料数据
数据名称:海南自由贸易港新办ICP所需资料数据 数据范围:自贸港新办ICP所需资料 数据时间:截止2024年 数据说明:自贸港新办ICP需准备资料清单;相关承诺书模版等全套资料。
-
可穿戴传感器动作分析数据集
该数据集旨在使用从可穿戴传感器收集的数据,在人机交互 (HCI) 环境中进行动作分类,并与动画设计的仿生视觉系统相结合。该数据集是作为一项研究的一部分收集的,该研究旨在改善实时人体动作识别,以增强虚拟现实 (VR) 和增强现实 (AR) 环境中的沉浸式体验。参与者:数据来自 30 名参与者(15 名男性和 15...
-
垃圾短信垃圾邮件收集数据集
从 Grumbletext 网站手动提取了 425 条垃圾短信。这是一个英国论坛,手机用户在此公开声明垃圾短信,但大多数用户并未报告收到的垃圾短信。 NUS SMS Corpus (NSC) 的 3,375 条随机选择的 SMS 短信子集,该数据集包含约 10,000...
-
加拿大温尼伯的光学雷达融合农田测绘
该数据集是“使用融合光学雷达数据集进行作物测绘”的副本,由 Iman Khosravi 博士(伊朗德黑兰大学地理学院遥感与 GIS 系)创建,它包含用于农田分类的融合双时态光学雷达数据,以表格形式显示,这些数据来自 RapidEye 卫星(光学)收集的图像和无人机合成孔径雷达(UAVSAR)于 2012 年 7 月 5 日和 7 月 14...
-
家庭用电研究数据
该数据集包含近四年来某个家庭用电量的详细测量数据。该数据以一分钟的采样率收集,可深入了解该家庭的各种电量和分表值。该数据集包含 2,075,259 个观测值,涵盖 2006 年 12 月至 2010 年 11 月期间的数据。...
-
空间材料结构优化数据集
此文件夹包含使用 top88 算法进行拓扑优化 (TO) 生成的数据。top88 算法有助于根据给定的体积分数优化设计空间内的材料分布,旨在实现结构最优设计。
-
纳米粒子电子结构数据集
atom_count:每个纳米粒子中的原子数,范围从 19 到 140。 structure_type:纳米粒子结构类型,随机分配为“立方八面体”、“二十面体”或“立方体”。 atomic_number:表示元素的原子序数,主要选择贵金属的典型值(例如,Pt 为 78,Au 为 79)。 电负性:代表金属元素的合成电负性值介于 2.0 和 3.0...
-
全球IP地址库数据集
全球IP地址是由Internet Assigned Numbers Authority (IANA)负责管理和分配的,IANA将IP地址分配给区域互联网注册机构(RIRs),由它们进一步分配给各个国家、地区或互联网服务提供商(ISPs)。 1. IPv4地址和IPv6地址 IPv4:IPv4地址是32位的,分为4组,每组8位,用“.”分隔,例如...
-
OpenFinData开源金融评测数据集
OpenFinData是由东方财富与上海人工智能实验室联合发布的开源金融评测数据集。该数据集代表了最真实的产业场景需求,是目前场景最全、专业性最深的金融评测数据集。它基于东方财富实际金融业务的多样化丰富场景,旨在为金融科技领域的研究者和开发者提供一个高质量的数据资源。
-
OCNLI中文自然语言训练数据集
OCNLI代表原始中文自然语言推论。它是中文自然语言推理的语料库,紧密按照MNLI的程序收集,但具有增强的策略,旨在实现更具挑战性的推理对。我们想强调的是,我们在创建数据集时没有使用人机翻译,因此我们的中文文本是原创的,没有翻译。
-
ETT (Electricity Transformer Temperature)
电力变压器温度 (ETT) 是电力长期部署的关键指标。该数据集由来自中国两个分离县的2年数据组成。为了探索长序列时间序列预测 (LSTF) 问题的粒度,创建了不同的子集,{ETTh1,ETTh2} 为1小时级,ETTm1为15分钟级。每个数据点由目标值 “油温” 和6个功率负载特征组成。火车/val/测试为12/4/4个月。
-
SST (Stanford Sentiment Treebank)
斯坦福情感库是一个带有完全标记的解析树的语料库,可以全面分析情感在语言中的构成影响。该语料库基于 Pang 和 Lee (2005) 引入的数据集,由从电影评论中提取的 11,855 个单句组成。它使用斯坦福解析器进行解析,包括来自这些解析树的总共 215,154 个独特的短语,每个短语由 3...
-
高校调查问卷文本数据集
高校学子在填写志愿时对目标高校校园生活往往并不了解,此项目志在帮助各学子通过在校学长学姐的亲身体验经验提前了解校园生活的方方面面。该数据是经过大模型处理过的数据,可以直接用于训练AI模型或用于RAG的数据集
-
机器设备故障数据集
本数据集包含多个关键性能指标,这些指标反映了机器在运行过程中的多种状态和环境因素。 利用本数据集分析机器在不同操作条件下的性能数据,可以为机器的维护、优化和故障预测提供数据支持。
-
感应电机热图像数据集
数据集: thermal-images-equip 该数据集包含了在电气设备(感应电机和变压器)状态监测背景下的热成像数据,主要用于检测设备内部的故障。所有故障均为工件生成的内部故障,不依赖外部因素或初始电气组件故障。
-
GeoQA (Geometric Question Answering)
GeoQA 是一个用于自动解决几何问题的数据集,包含 5,010 个几何问题和相应的注释程序,说明了给定问题的解决过程 与另一个公开可用的数据集 GeoS 相比,GeoQA 大 25 倍,其中程序注释可以提供实用的未来研究明确和可解释的数值推理的测试平台。
-
-
DRCD (Delta Reading Comprehension Dataset)
一个数据集,其中包含 2,221 个来自不同学科(历史、生物学、地理和哲学)的十二年级入学考试的问题,以及来自历史在线测验的 412 个附加问题。
-
SFT多轮中文对话文本数据集
SFT多轮对话文本数据集。由来自中国的644名不同ID的采集人独家贡献,每组对话由两位采集人围绕一个主题展开,上下文对话与当前的内容逻辑相关。适用于训练大模型多轮对话 (back and forth conversation)、上下文逻辑推理能力,以及端到端对话大模型。 数据组成...
-
综合性食谱语料库
完整的食谱语料库包含1,520,327种中国食谱。其中,1,242,206食谱属于30,060菜肴。一道菜平均有41.3个食谱。食谱的平均长度是224个字符。最大长度为62,722个字符,最小长度为10个字符。食谱由415,272位作者贡献。其中,最有生产力的作者上传5,394食谱。



