-
龙珠问答数据集
2025年2月17日 200 190 178
龙珠问答语料库是一个精选数据集,旨在训练和评估特定于龙珠世界的问答模型。它包含多个文本文件,每个文件都充满了结构化和非结构化文本数据,涵盖了龙珠系列的各个方面,包括人物传记、力量等级、故事情节、转变、战斗、技术和传说。 每个文本文件都经过精心组织,以确保全面涵盖不同的主题,例如: 角色信息:详细的个人资料、能力和关系。 故事情节和弧线:龙珠、龙珠... -
植物疾病检测数据集
2025年2月13日 170 50 39
植物疾病数据集由印度理工学院的一组研究人员创建,最初在一篇研究论文中进行了描述。其中一位作者 Pratik Kayal 已在GitHub上分享了该数据集,可供公众使用。PlantDoc 数据集包含 13 种不同植物物种的总共 2,569 张图像。该数据集分为 30 个不同的类别,标签指示每张图像是健康的还是患病的。数据集内共有 8,851... -
狗牌照数据集:纽约市有效狗证
2025年2月13日 400 179 136
根据法律规定,居住在纽约市的所有狗主人都必须为他们的狗办理许可证。数据来源于 DOHMH 狗许可证系统,狗主人可以在此申请和续签狗许可证。 每条记录代表了该年内有效的唯一狗执照,但不一定是每只狗的唯一记录,因为在年内续签的执照会产生有效执照期限的单独记录。每条记录代表了该只狗在一年的时间范围内的一个唯一执照期限。... -
英语至阿萨姆语平行数据集
2025年2月14日 287 105 101
此文件中有数十万个英语到阿萨姆语的平行数据集。 注意-清理数据集 1_.eng.txt - 有更多并行的英语数据集 1_assamese.xt - 有更多并行的阿萨姆语数据集 -
纽约地铁路线数据统计
2024年11月8日 90 54 2
数据用途简介,该数据集可用于多种应用场景,包括但不限于地理信息系统(GIS)中的地图绘制和空间分析、交通规划中的地铁线路优化、数据可视化中的地铁网络展示,以及城市发展和公共交通研究中的基础数据支持。 通过分析地铁线路的几何路径和长度,城市规划者和交通管理者可以更好地理解地铁网络的覆盖范围和运营效率,从而制定更有效的交通和城市发展策略。 -
国际权威板球数据平台
2025年4月12日 30 149 29
数据来源:互联网公开数据 数据概述: 本数据集收录了1990年至2017年间来自ESPN Cricinfo网站的板球运动员详细信息。通过对56000名运动员的网站页面进行抓取,经过数据清洗和筛选,最终获得了41000名运动员的数据记录。数据涵盖了ODI、Tests和T20三种主要板球赛事的运动员表现数据,包括个人基本信息、比赛记录、成就等关键要素。... -
核聚变实验的模拟数据
2025年2月13日 290 143 100
核能聚变实验的模拟数据集对于对核聚变领域感兴趣的研究人员和爱好者来说都是宝贵的资源。该数据集由 100,000 行组成,每行代表一个实验,并包含各种对于了解聚变反应成功或失败至关重要的参数。这些参数包括燃料密度、温度、约束时间、燃料纯度、能量输入、功率输出、压力和中子产量等。... -
印度洛卡萨巴大选结果数据集
2025年6月8日 30 208 50
数据概述: 本数据集涵盖了2019年、2014年、2009年及2004年印度全国大选(洛卡萨巴选举)的结果数据。数据来源于印度选举委员会,并经过整理以方便分析。数据集包含了各选区的基本信息、获胜候选人及其所属政党、选民数量及实际投票数量、以及获胜方的得票优势等关键指标,为研究印度选举动态和政党表现提供了详实的数据支持。 数据用途概述:... -
电子商务数据的购物者意图预测
2024年12月19日 30 56 7
数据集以一个大型文本文件(.csv 格式)提供,并包含在一个 zip 压缩包中,压缩包中还包含 使用条款 的副本。最终数据集包含 5,433,611 个独立事件,是首个此类数据集,首次公开供研究社区使用 -
特朗普政治言论分析用推特数据集
2025年5月25日 30 145 37
数据简介: 该数据集收集了与唐纳德·特朗普(Donald Trump)相关的推文文本及其元信息,内容涵盖用户生成的转发、评论和直接提及。数据时间上集中于2015年前后美国大选时期,具有一定的舆情代表性,可用于情感分析、文本分类、信息传播研究、政治观点分析等多种任务。 数据源自 Twitter... -
土壤环境分析数据集
2025年2月10日 400 57 2
土壤环境分析数据集包含 5 个子文件夹,每个子文件夹代表一种不同类型的土壤环境。该数据集专为分析和分类任务而设计,尤其侧重于不同环境条件下的不同土壤类型。数据集中的每幅图像都调整为 256x256 像素大小并以 .jpg 格式保存,以保持一致性,并方便在机器学习和计算机视觉任务中使用。 数据集概述: 文件夹总数:5 图像格式:JPG... -
生食加工食品和预制食品的成分数据集
2024年12月19日 30 99 24
该数据库由几组数据组成:食物描述、营养成分、重量和尺寸、脚注和数据来源。营养数据文件包含每 100 克食物可食用部分的平均营养值,以及进一步描述平均值的字段。提供了有关食物家庭测量的信息。给出了不含垃圾的可食用材料的重量。对于少数项目,提供了脚注,其中有关食物描述、重量和尺寸或营养价值的信息无法在现有字段中容纳。... -
美国奶制品营养成分分析数据集
2025年6月20日 30 105 90
数据简介: 本数据集包含美国农业部(USDA)标准数据库中部分奶制品的详细营养成分信息,涵盖黄油和多种奶酪产品。每条记录代表一种具体食品类型,其营养信息基于可食部分的100克测量。 字段定义: ndb_no:食品编号,USDA食品数据库中的唯一标识 short_desc:食品简要描述 water_g:水分含量(克) energy_kcal:能量(千卡)... -
-
雷根斯堡儿童阑尾炎数据集
2025年1月7日 30 47 7
数据集名称:雷根斯堡儿童阑尾炎数据集 数据数量:2101 数据集关键词:阑尾炎, 雷根斯堡 数据集格式:bmp, jpg, xlsx, md, png -
建筑墙面破损等视觉缺陷识别图像数据集
2025年7月23日 30 138 24
数据来源: Building Defect Detection由研究团队采集并整理,聚焦于城市建筑环境中的墙体缺陷检测任务。原始图像均为实拍 RGB 照片,并通过专家标注六类典型结构性缺陷及正常墙体图像。为提升模型训练的效果和泛化能力,还基于原始图像生成了增强版本,构成完整的 BD3 数据集。 数据内容: 包含两个子集,总计 17,965 张图像:...