-
Objaverse_Porta_de_la_Capella_de_Gràcia_Based_文化遗产门体三维数字化完整数据
2025年12月18日 30 14 10
数据集概述 该数据集包含与“Porta de la Capella de Gràcia”相关的6个文件,以.jpeg格式图片文件为主,辅以1个.glb格式文件,无目录结构,未提供文件内容预览或说明文档。 文件详解 图片文件(共5个):...
-
Objaverse_Obj01_Based_三维模型与缩略图完整数据
2025年12月18日 30 179 114
数据集概述 该数据集包含Obj01相关的文件,主要由缩略图和三维模型文件构成,文件类型以.jpeg格式的图片为主,辅以一个.glb格式的三维模型文件,未进行训练测试、数据标签或原始处理数据的划分。 文件详解 文件名称及类型分布:...
-
ApacheJIT即时缺陷预测大型数据集
2025年12月18日 30 132 111
数据集概述 本数据集为即时缺陷预测任务提供大规模数据支持,包含4个子集文件,涵盖提交标识符、提交指标等特征及缺陷标记。同时提供数据集构建的Python脚本、环境配置文件和操作说明,适用于模型训练与评估。 文件详解 数据集文件(位于dataset/目录下):...
-
古希腊语与葡萄牙语翻译对齐标准与黄金标准数据集
2025年12月18日 30 194 15
数据集概述 本数据集包含古希腊语文本与葡萄牙语翻译对齐的指导标准及黄金标准数据,基于古希腊语-英语对齐指南改编,由领域专家使用Ugarit工具完成对齐,可支持相关文本对齐任务、数据集构建或自动化模型训练。 文件详解 文件名称:grc.txt 文件格式:.txt 内容说明:原始古希腊语文本文件 文件名称:por.txt 文件格式:.txt...
-
敲击不同物体不同位置产生的音频数据集
2025年12月15日 30 3 2
数据集概述 本数据集包含敲击三种不同物体(纸质CD盒、玻璃啤酒瓶、塑料桶)不同位置产生的音频文件,每种物体对应训练与测试样本,同时提供说明性PDF文档,为音频特征分析及物体识别研究提供数据支持。 文件详解 该数据集包含7个文件,具体说明如下: - MAT格式音频样本文件(共6个): -...
-
AUTH_OpenDR增强型CelebA多视角人脸图像数据集
2025年12月14日 30 54 19
数据集概述 该数据集是基于CelebA人脸数据集生成的多视角人脸图像数据集,由塞萨洛尼基亚里士多德大学利用OpenDR H2020研究项目开发的软件创建。数据集包含对CelebA子集图像进行偏航轴和俯仰轴旋转生成的合成图像,提供重建数据集的说明和脚本。 文件详解 文件名称: ACelebA.pdf 文件格式: PDF (.pdf) 文件内容:...
-
MAUD_v1并购协议理解数据集
2025年12月14日 30 125 51
数据集概述 该数据集包含由经验律师监督标注的152份并购协议、47000余个标签,覆盖2021年美国律师协会公共目标交易点研究的92个问题,用于法律合同审查的自然语言处理研发。 文件详解 文件名称:MAUD v1 README.pdf 文件格式:PDF 内容说明:包含数据集的说明文档,提供数据集背景、使用方法等信息 文件名称:maud_v1.zip...
-
Cube_Altar_Based_立方体祭坛3D模型可视化完整数据
2025年12月14日 30 135 18
数据集概述 本数据集围绕Cube Altar主题,包含OBJ文件和JPEG图片,用于展示Cube Altar的3D模型及其不同角度的缩略图,未提供数据来源,适合3D模型相关研究与应用。 文件详解 文件名称:3306964398c442efa144fa4cd740f369.glb,文件格式:GLB,为Cube Altar的3D模型文件...
-
现代汉语方言核心词特征词集CLDF数据集2007
2025年12月14日 30 195 168
数据集概述 该数据集基于2007年《现代汉语方言核心词·特征词集》构建,采用CLDF格式存储,包含现代汉语方言的核心词汇与特征词数据,为方言词汇研究提供结构化资源。 文件详解 文件名称:lexibank/liusinitic-v1.4.zip 文件格式:ZIP压缩包...
-
可操作警告推荐与弱监督学习数据集
2025年12月13日 30 29 25
数据集概述 该数据集围绕可操作警告的推荐研究构建,包含可操作警告、误报、提交信息、代码变更的原始数据,以及用于两阶段模型训练和测试的数据集,同时提供数据收集、弱监督处理及模型实现的代码。 文件详解 文件名称: Warning.zip 文件格式: ZIP压缩包 内容说明: 压缩包内包含以下核心内容 原始数据:...
-
机器学习用于错误信息检测的系统综述数据集
2025年12月12日 30 128 2
数据集概述 本数据集为《SoK: Machine Learning for Misinformation Detection》的配套标注与复现材料,包含论文语料标注、论文筛选标准文档及三个复现分析子文件夹,覆盖文章、用户、来源三类错误信息检测场景的数据集与代码。 文件详解 标注文件: annotations_aec.tsv:...
-
LaTeX数学公式图像匹配数据集230k
2025年12月12日 30 177 50
数据集概述 该数据集包含超过二十三万组LaTeX数学公式及其对应的PNG格式图像,图像分辨率为72dpi且尺寸各异。数据来源于arXiv的LaTeX源文件,经解析生成,是版本3更新后的数据集,规模从十八万扩展至二十三万。 文件详解 文件夹与文件: generated_png_images文件夹:包含所有PNG格式的数学公式图像文件...
-
SocialDisNER西班牙语推文疾病提及标注数据集
2025年12月12日 30 108 89
数据集概述 该数据集为SocialDisNER语料库,包含人工标注的西班牙语推文疾病提及金标准数据(训练集5000条、验证集2500条)及自动标注的大规模银标准数据(85000余条推文),覆盖疾病、药物等多类实体,用于研究社交媒体健康内容中的疾病提及识别。 文件详解 主数据压缩包: SocialDisNER_Data.zip 包含training-...
-
Hugging_Face模型到软件工程活动编目复制包
2025年12月12日 30 160 55
数据集概述 该数据集是论文《Cataloguing Hugging Face Models to Software Engineering Activities: Automation and Findings》的复制包,包含复制研究所需的脚本、原始数据集、人工验证标注及最终整理数据集等相关内容。 文件详解 文件名称:...
-
Objaverse_Source_Mustafa_Ataturk_Based_历史人物数字资源完整数据集
2025年12月12日 30 127 101
数据集概述 该数据集包含与Mustafa Ataturk相关的文件,主要由JPEG格式图片和一个GLB格式文件组成,文件均直接存储于根目录,无子目录结构,未进行训练/测试等数据拆分。 文件详解...
-
FaVCI2D具有挑战性冒名者与多样化人口统计特征的人脸验证数据集
2025年12月11日 30 25 23
数据集概述 该数据集聚焦人脸验证任务,针对现有数据集冒名者对挑战性不足、人口统计特征多样性欠缺的问题,构建包含视觉相似冒名者对及性别、国家、年龄元数据的FaVCI2D数据集,用于细粒度分析与模型性能验证。 文件详解 文件名称:favci2d_readme.pdf 文件格式:PDF...
-
Webis_Revenue_10_德国新闻营收声明标注数据集
2025年12月11日 30 111 94
数据集概述 该数据集包含2003至2009年德国29家新闻网站的1128篇新闻文章,由领域专家手动标注了2075条企业或市场营收声明,每条声明包含7个核心属性,为研究新闻文本中的营收信息提取提供标注数据支持。 文件详解 压缩数据文件:...
-
TableLabler_可扩展表格数据标注数据集
2025年12月11日 30 154 60
数据集概述 该数据集是TableLabler项目的预发布版本,旨在通过语言模型实现表格数据的可扩展标注,支持表格数据集的创建。包含核心数据压缩包和补充材料文档,为研究表格数据标注的可扩展方法提供基础数据。 文件详解 TableLabler dataset.zip:压缩包格式,可能包含TableLabler项目用于表格数据标注的核心数据集...
-
家庭环境音频事件分类的开集识别与少样本学习数据集
2025年12月11日 30 184 155
数据集概述 该数据集聚焦家庭环境音频事件分类,包含34类共1360条音频片段,分为模式声音和干扰声音两类。专为开集识别(OSR)和少样本学习(FSL)任务设计,提供两种基线系统结果,解决音频领域少样本学习专用数据集缺失问题。 文件详解 文件名称:Open-set_Recognition_Few-...
-
CR_1_B_ET_Based_定位标识图像文本数据完整分析数据集
2025年12月10日 30 115 94
数据集概述 该数据集包含五十七份文件,涵盖图片、文本和压缩包等多种类型。核心内容为带有编号或定位标识的图片文件及配套文本文件,可能涉及特定主题的图像标注或坐标记录,为相关领域的分析提供基础数据支持。 文件详解...



