找到2,381个数据集

标签: 数据清洗实践

过滤结果
  • 情绪预测数据集

    2025年4月14日   

    情绪预测数据集 数据来源:互联网公开数据 标签:情绪预测, WhatsApp状态,自然语言处理,情感分析,机器学习,文本清理,情感分类 数据概述:...
    packageimg
  • Python编程语言常见问题解答数据集FAQ-互联网抓取数据

    2025年4月14日   

    Python编程语言常见问题解答数据集FAQ-互联网抓取数据 数据来源:互联网公开数据 标签:Python, 编程, FAQ, 常见问题, 编程语言, 抓取数据, 学习资源 数据概述:...
    packageimg
  • 俄语关系抽取Rebel数据集去重合并版

    2025年4月14日   

    俄语关系抽取Rebel数据集去重合并版 数据来源:互联网公开数据 标签:俄语,关系抽取,自然语言处理,文本数据,机器学习,Rebel,数据集,语言模型 数据概述: 本数据集为俄语版Rebel数据集,用于关系抽取任务。原始数据集由Hugging...
    packageimg
  • 数独谜题数据集

    2025年4月14日   

    数独谜题数据集 数据来源:互联网公开数据 标签:数独,谜题,游戏,人工智能,单数法则,交互法则,裸数对,隐数对,求解技术 数据概述: 本数据集包含了一系列数独谜题,这些谜题可以通过人类玩家使用单数法则、交互法则、裸数对和隐数对等求解技术来解决。数据集中的谜题旨在用于开发和训练人工智能数独求解器。 数据用途概述:...
    packageimg
  • 过山车数据集1960-2023

    2025年4月14日   

    过山车数据集1960-2023 数据来源:互联网公开数据 标签:过山车,主题公园,娱乐设施,数据清洗,数据分析,游客体验,安全标准 数据概述: 本数据集收录了1960年至2023年间全球各地的过山车数据,涵盖了多种主题公园和游乐设施。数据集包含过山车的名称、类型、高度、速度、长度、开业年份、安全标准等关键信息,为数据清洗和分析提供了丰富的数据资源。...
    packageimg
  • Kaggle与Binder平台OCR引擎测试图像数据集

    2025年4月14日   

    Kaggle与Binder平台OCR引擎测试图像数据集 数据来源:互联网公开数据 标签:OCR,图像识别,光学字符识别,文本提取,Jupyter Notebook,Kaggle,Binder,机器学习,计算机视觉 数据概述: 本数据集包含一组专为光学字符识别(OCR)测试设计的图像,主要用于在Kaggle和Binder平台上进行Jupyter...
    packageimg
  • 数据科学实践训练数据集

    2025年4月14日   

    数据科学实践训练数据集 数据来源:互联网公开数据 标签:数据科学,实践,训练,数据类型,数据分析,机器学习 数据概述: 本数据集专为数据科学实践设计,包含了多种类型的数据,包括数值型、类别型、时间序列等,旨在为学习者提供一个全面的数据分析和机器学习训练平台。数据集中的信息涵盖了多个领域,如医疗、金融、市场营销等,为用户提供了丰富的实践素材。...
    packageimg
  • 不均衡风险评估数据集

    2025年4月14日   

    不均衡风险评估数据集 数据来源:互联网公开数据 标签:风险评估,不均衡数据,特征工程,机器学习,分类预测 数据概述: 本数据集包含用于确定风险目标(1=高风险, 0=低风险)的不均衡且未经清理的特征集。数据集共有34个特征、1个目标变量和1个标识符列。特征包括整数、浮点数和类别数据等多种类型,适用于风险预测和分类模型的训练。 数据用途概述:...
    packageimg
  • 随机美国人员数据集

    2025年4月14日   

    随机美国人员数据集 数据来源:互联网公开数据 标签:美国人员,随机数据,用户ID,姓名,社会保障号,人口统计,数据分析 数据概述: 本数据集包含随机生成的美国人员信息,涵盖了用户ID、姓名、社会保障号等关键字段。该数据集旨在提供一个用于模拟和分析的基准数据集,适用于多种研究和分析场景。 数据用途概述:...
    packageimg
  • 推特评论情感分析数据集-用户评论-2024

    2025年4月14日   

    推特评论情感分析数据集-用户评论-2024 数据来源:互联网公开数据 标签:推特,情感分析,文本挖掘,用户评论,负面情绪,机器学习,NLP,评论数据 数据概述:...
    packageimg
  • DSbowl19肺部疾病诊断竞赛特征数据集

    2025年4月14日   

    DSbowl19肺部疾病诊断竞赛特征数据集 数据来源:互联网公开数据 标签:医疗,疾病诊断,机器学习,特征工程,数据竞赛,肺部疾病,DSbowl19 数据概述: 本数据集包含了为DSbowl19(Data Science Bowl 2019)竞赛构建的特征。 这些特征旨在用于预测肺部疾病,并为参赛者提供用于构建机器学习模型的输入数据。...
    packageimg
  • 印度二手车验证与匹配数据集1963-2021

    2025年4月14日   

    印度二手车验证与匹配数据集1963-2021 数据来源:互联网公开数据 标签:二手车,验证,匹配,车辆信息,品牌,型号,年份 数据概述: 本数据集用于补充“二手车价格预测”比赛的数据,包含对多个二手车品牌、型号和年份的验证结果。通过结合“Used Car Price Prediction Dataset”和“Regression of Used Car...
    packageimg
  • 乐高积木与零件数据集

    2025年4月14日   

    乐高积木与零件数据集 数据来源:互联网公开数据 标签:乐高, 积木, 零件, 数据整理, 玩具行业, 产品数据, 数据分析 数据概述: 本数据集是对原始乐高数据库(LEGO...
    packageimg
  • 德国萨克森房地产拍卖数据集

    2025年4月14日   

    德国萨克森房地产拍卖数据集 数据来源:互联网公开数据 标签:房地产拍卖,德国,萨克森,赢家的诅咒,时间序列,市场分析,房地产评估 数据概述:...
    packageimg
  • 孟加拉语文本噪声标注数据集-情感分析应用-2024

    2025年4月14日   

    孟加拉语文本噪声标注数据集-情感分析应用-2024 数据来源:互联网公开数据 标签:孟加拉语,文本,噪声,标注,情感分析,自然语言处理,W-NUT,机器学习,语言学 数据概述: 本数据集为多标签数据集,旨在用于孟加拉语文本中的噪声识别。该数据集由四位母语为孟加拉语的专家标注,标注可信度达到90%。Fleiss'...
    packageimg
  • Python数据科学最佳实践演示数据集-PyCon2019

    2025年4月14日   

    Python数据科学最佳实践演示数据集-PyCon2019 数据来源:互联网公开数据 标签:Pandas,数据科学,最佳实践,教程,Python,数据分析,数据处理,PyCon,演示数据 数据概述: 本数据集源于PyCon...
    packageimg
  • 洛斯阿拉莫斯国家实验室VO-CHUN-HA地震预测数据集

    2025年4月14日   

    洛斯阿拉莫斯国家实验室VO-CHUN-HA地震预测数据集 数据来源:互联网公开数据 标签:地震预测,机器学习,数据竞赛,时间序列,特征工程 数据概述: 本数据集来源于洛斯阿拉莫斯国家实验室举办的VO-CHUN-...
    packageimg
  • 汽车规格数据集

    2025年4月14日   

    汽车规格数据集 数据来源:互联网公开数据 标签:汽车规格,车辆信息,汽车品牌,发动机,变速箱,油耗,尺寸,数据清洗,自然语言处理,分类 数据概述:...
    packageimg
  • CTDS展示更新CSV数据集

    2025年4月14日   

    CTDS展示更新CSV数据集 数据来源:互联网公开数据 标签:数据科学,数据分析,CSV文件,更新记录,讨论社区,Kaggle 数据概述: 本数据集为CTDS展示的更新CSV文件,是对原始数据集的修正版本。更新内容主要涉及"Cleaned...
    packageimg
  • 平衡虚假工作招聘信息集

    2025年4月14日   

    平衡虚假工作招聘信息集 数据来源:互联网公开数据 标签:虚假招聘信息,工作招聘,数据平衡,机器学习,文本分析,雇佣趋势,数据科学 数据概述: 本数据集是Mohamed Mustafa...
    packageimg