找到2,381个数据集

标签: 数据清洗实践

过滤结果
  • 用于学习的合成数据集:基本回归学习数据集

    2025年2月13日   

    提出了 4 个数据框来解决回归问题。数据框变量的描述在相应的文档 .
    packageimg
  • JUIndoorLoc:使用 WiFi 进行室内定位

    2025年2月12日   

    使用 WiFi 信号强度预测室内区域用户的位置 用于室内定位的WiFi 指纹数据集JUIndoorLoc包含从多个预定义室内位置的多个 WiFi 接入点 (AP) 收集的接收信号强度数据 (RSS)。数据集中的每个条目都对应于由特定坐标作为标签标识的唯一位置,并包含来自附近 AP 的 RSS...
    packageimg
  • HotpotQA维基百科问答数据集

    2024年11月10日   

    HotpotQA 是收集在英语维基百科上的问答数据集,包含大约 113K 众包问题,这些问题的构建需要两篇维基百科文章的介绍段落才能回答。数据集中的每个问题都带有两个黄金段落,以及这些段落中的句子列表,众包工作人员认为这些句子是回答问题所必需的支持事实。 HotpotQA 提供了多种推理策略,包括涉及问题中缺失实体的问题、交叉问题(什么满足属性 A...
    packageimg
  • CommonsenseQA文本问答数据集

    2024年11月10日   

    CommonsenseQA 是常识问答任务的数据集。该数据集由 12,247 个问题组成,每个问题有 5 个选项。数据集是由 Amazon Mechanical Turk 工作人员在以下过程中生成的(括号中提供了一个示例):人群工作人员从 ConceptNet(“河流”)和三个目标概念(“瀑布”、“桥梁”、“ Valley”)都通过相同的...
    packageimg
  • XQuAD

    2024年11月10日   

    XQuAD(Cross-lingual Question Answering Dataset)是评估跨语言问答性能的基准数据集。该数据集包含来自 SQuAD v1.1(Rajpurkar 等人,2016 年)开发集的 240 个段落和 1190...
    packageimg
  • MathQA

    2024年11月10日   

    本数据集是通过使用一种新的表示语言对 AQuA-RAT 数据集进行注释来收集的。 AQuA-RAT 提供了问题、选项、理由和正确选项。
    packageimg
  • FinQA财务文本数据集

    2024年11月10日   

    FinQA 是一个新的大型数据集,由财务专家编写,在财务报告中包含问答对。该数据集包含 8,281 个财务 QA 对,以及它们的数值推理过程。
    packageimg
  • SQuAD (Stanford Question Answering Dataset)问答数据集

    2024年11月10日   

    斯坦福问答数据集 (SQuAD) 是一个阅读理解数据集,由众包工作人员在一组维基百科文章中提出的问题组成,其中每个问题的答案都是相应阅读文章或问题的一段文本或跨度可能无法回答。
    packageimg
  • 全国中草药名鉴谢宗万等主编全2册

    2024年11月11日   

    《全国中草药名鉴》共收录中国中草药772科13200余条,其中植物药369科11470余条(包括藻类、真菌类、地衣类、苔藓类、蕨类、裸子植物、被子植物);动物药403科1630余条;矿物药160余条。全书分上册、下册及索引三册出版。上册为中草药同物异名集,下册为中草药同名异物集。 [1]...
    packageimg
  • 财务分析与报表造假实务专题课

    2024年11月11日   

    帮助读者深入了解财务处理的细节和企业财务状况的解读。 以下是简介: 会计科目的细节分析:专题01“盘点那些会计科目中的‘白富美’”揭示了一些财务报表科目中隐藏的优质资产,帮助读者更好地理解财务报表中的关键项目。 资产处理与传承:专题02“存货、固定资产账务处理的以讹传讹”分析了存货和固定资产在财务处理中的常见误区,帮助读者掌握正确的会计处理方法。...
    packageimg
  • 多视角角色对话HQA 数据集

    2024年11月9日   

    这是一个基于用户聊天记录的问答数据集。我们找到了一个包含两人或多人对话的文本格式的数据集;数据集名称为“Ubuntu 对话语料库”。从该数据集中,我们根据 dialogID(代表一个唯一的聊天室)分析用户的聊天。根据...
    packageimg
  • 高校招生问答数据集

    2024年11月9日   

    数据收集过程始于对选定的高等教育机构的网站进行网络抓取,收集 2023 年 7 月至 9...
    packageimg
  • 纽约商用自行车单元检查数据

    2024年11月24日   

    数据集名称:纽约商用自行车单元检查数据 数据数量:1 数据集关键词:检查数据, 自行车 数据集格式:txt, csv
    packageimg
  • 肝脏疾病数据集

    2025年1月7日   

    数据集名称:肝脏疾病数据集 数据数量:10 数据集关键词: 数据集格式:group, expense, delay, data, txt, cost, names, README
    packageimg
  • 数据集包含带有积极或消极情绪标签的句子

    2025年1月7日   

    数据集名称:数据集包含带有积极或消极情绪标签的句子 数据数量:4 数据集关键词:消极情绪 数据集格式:txt
    packageimg
  • 网络管理员考试必备

    2024年10月16日   

    包含内容: 1. 考试说明:为你梳理考试的整体结构和要求,提供全面的备考指导。 2. 考试教程:第五版权威教程,覆盖最新考试内容,帮助你系统复习。 3. 历年真题解析:必练真题及其详细解析,直击考试核心考点。 4. 高级教程与实训材料:不仅仅是考试,还让你在实践中强化技能。 5. 报名流程指南:确保你顺利报名,轻松备战考试。
    packageimg
  • 成人自闭症谱系障碍筛查数据

    2025年1月8日   

    数据集名称:成人自闭症谱系障碍筛查数据 数据数量:2 数据集关键词:自闭症 数据集格式:arff, docx
    packageimg
  • 篮球练习中收集的数据

    2025年1月8日   

    数据集名称:篮球练习中收集的数据 数据数量:82 数据集关键词: 数据集格式:txt
    packageimg
  • 牛津帕金森病检测数据集

    2025年1月7日   

    数据集名称:牛津帕金森病检测数据集 数据数量:4 数据集关键词:帕金森病 数据集格式:data, names
    packageimg