找到2,381个数据集

标签: 数据清洗实践

过滤结果
  • 太空船泰坦尼克号准备数据集

    2025年4月14日   

    太空船泰坦尼克号准备数据集 数据来源:互联网公开数据 标签:太空船,泰坦尼克号,竞赛数据,特征工程,数据预处理,交叉验证,机器学习 数据概述:...
    packageimg
  • 医疗数据分析模拟患者信息数据集

    2025年4月14日   

    医疗数据分析模拟患者信息数据集 数据来源:互联网公开数据 标签:医疗数据,模拟数据,患者信息,数据分析,机器学习,数据科学,健康研究 数据概述:...
    packageimg
  • DataScienceOsaka2022冬季赛重复数据及评分数据集

    2025年4月14日   

    DataScienceOsaka2022冬季赛重复数据及评分数据集 数据来源:互联网公开数据 标签:数据科学,机器学习,竞赛,重复数据,评分,预测,Data Science Osaka,2022 数据概述: 本数据集是Data Science Osaka...
    packageimg
  • 英语单词家族数据集1963-2021

    2025年4月14日   

    英语单词家族数据集1963-2021 数据来源:互联网公开数据 标签:英语单词,词典,自然语言处理,NLP,词汇学,教育培训 数据概述: 本数据集收录了按字母顺序排列的全部英语单词,涵盖了从A到Z的所有单词条目。数据集适用于自然语言处理项目的参考和验证,为词典编纂、词汇学研究和教育培训提供了全面的单词资源。 数据用途概述:...
    packageimg
  • 印度农村地区无信用评分人群贷款数据集1963-2021

    2025年4月14日   

    印度农村地区无信用评分人群贷款数据集1963-2021 数据来源:互联网公开数据 标签:农村信贷,信用评分,贷款审批,数据预处理,特征工程,金融分析,信用风险评估 数据概述:...
    packageimg
  • 综合领域数据集

    2025年4月14日   

    综合领域数据集 数据来源:互联网公开数据 标签:地址,机场信息,动物,应用,个人信息,公司信息,医疗数据,财务信息,建筑细节,元数据 数据概述:...
    packageimg
  • 密码数据集

    2025年4月14日   

    密码数据集 数据来源:互联网公开数据 标签:密码,密码强度,网络安全,数据安全,密码生成,密码评估,字符分析 数据概述: 本数据集包含10,000个随机生成的密码,每个密码长度在8到16个字符之间。密码由大小写字母、数字和特殊字符混合构成。数据集中的每个条目包含以下属性: - Password:实际的密码字符串。 - Has...
    packageimg
  • 产品属性提取任务数据集

    2025年4月14日   

    产品属性提取任务数据集 数据来源:互联网公开数据 标签:产品属性提取,自然语言处理,机器学习,电子商务,产品推荐,属性值对,文本分析 数据概述:...
    packageimg
  • 飞行器与鸟类轨迹数据噪声模拟数据集V2

    2025年4月14日   

    飞行器与鸟类轨迹数据噪声模拟数据集V2 数据来源:互联网公开数据 标签:轨迹数据,噪声,无人机,飞机,鸟类,目标识别,时间序列,机器学习,数据集 数据概述: 本数据集包含无人机、飞机和鸟类的轨迹数据,每个文件代表一个目标的轨迹。数据集以CSV格式存储,旨在测试基于轨迹数据的目标识别算法。数据经过噪声模拟,模拟了真实世界中可能存在的各种干扰。...
    packageimg
  • 梅西推特数据集1963-2021

    2025年4月14日   

    梅西推特数据集1963-2021 数据来源:互联网公开数据 标签:梅西,推特,足球,社交媒体分析,情感分析,粉丝互动,体育新闻 数据概述:...
    packageimg
  • 仇恨言论数据集-01

    2025年4月14日   

    仇恨言论数据集-01 数据来源:互联网公开数据 标签:仇恨言论,社交媒体,推特,文本分析,机器学习,自然语言处理 数据概述: 本数据集包含用于识别仇恨言论的推特训练集和测试集,涵盖了2010年至2021年间推特平台上发布的大量文本数据。数据集经过标注,区分了包含仇恨言论和非仇恨言论的推文,适用于仇恨言论检测任务的研究和开发。 数据用途概述:...
    packageimg
  • 伊斯兰堡房价数据集

    2025年4月14日   

    伊斯兰堡房价数据集 数据来源:互联网公开数据 标签:伊斯兰堡,房价,房地产,数据清理,市场分析,投资决策,城市规划 数据概述: 本数据集来源于zameen.com的巴基斯坦房屋价格数据,经过数据清理处理,特别提取了伊斯兰堡市的房价信息。数据集包含近期内伊斯兰堡地区房屋的基本信息、价格、位置、面积等关键要素,为研究伊斯兰堡房地产市场提供了详实的数据支撑。...
    packageimg
  • 学生考试数据集含问题

    2025年4月14日   

    学生考试数据集含问题 数据来源:互联网公开数据 标签:学生考试,成绩分析,数据清洗,教育研究,学习表现 数据概述:...
    packageimg
  • TPS十一月五折交叉验证数据集

    2025年4月14日   

    TPS十一月五折交叉验证数据集 数据来源:互联网公开数据 标签:TPS,十一月,数据分割,交叉验证,机器学习,数据集 数据概述: 本数据集为TPS十一月竞赛准备的数据集,包含了原始数据中的“id”列以及新增的“fold_no”列。其中,“fold_no”列范围为0到4,代表了数据集被划分为的五个不同折叠(fold),用于交叉验证过程。 数据用途概述:...
    packageimg
  • Shopee商品检测竞赛OCR文本识别数据集

    2025年4月14日   

    Shopee商品检测竞赛OCR文本识别数据集 数据来源:互联网公开数据 标签:OCR,文本识别,商品检测,Shopee,图像处理,深度学习,竞赛数据 数据概述: 本数据集包含了从Shopee Code League(SCL)商品检测竞赛中提取的OCR(光学字符识别)文本数据。这些数据是利用Keras-...
    packageimg
  • 推荐分析初学者数据集

    2025年4月14日   

    推荐分析初学者数据集 数据来源:互联网公开数据 标签:数据分析,数据可视化,数据清理,初学者,项目示例,学习资源 数据概述: 本数据集是我进行的首次数据分析的项目成果,包含了数据清理、分析和可视化的全过程。数据集本身可能需要进一步的完善,但作为一个初学者的尝试,它展示了从原始数据到有意义结论的完整流程。 数据用途概述:...
    packageimg
  • 句子完成度预测文本分类数据集

    2025年4月14日   

    句子完成度预测文本分类数据集 数据来源:互联网公开数据 标签:自然语言处理,句子完成度,文本分类,弱监督学习,新闻头条,文本数据清理 数据概述:...
    packageimg
  • 澳大利亚汽车价格原始数据集

    2025年4月14日   

    澳大利亚汽车价格原始数据集 数据来源:互联网公开数据 标签:汽车价格,澳大利亚,原始数据,数据清洗,数据预处理,汽车市场分析 数据概述: 本数据集包含了从"https://www.ccarprice.com/au/"网站抓取的2683辆汽车的原始信息。数据未经过任何清洗和预处理,适合用于实践数据清洗和预处理技巧。 数据用途概述:...
    packageimg
  • 孟加拉语讽刺检测数据集2022

    2025年4月14日   

    孟加拉语讽刺检测数据集2022 数据来源:互联网公开数据 标签:讽刺检测,孟加拉语,自然语言处理,文本分析,深度学习,BERT,可解释AI 数据概述:...
    packageimg
  • 鲍鱼年龄预测数据集-性别-尺寸-重量与年龄-混合数据集

    2025年4月14日   

    鲍鱼年龄预测数据集-性别-尺寸-重量与年龄-混合数据集 数据来源:互联网公开数据 标签:鲍鱼,年龄预测,生物数据,机器学习,回归分析,Kaggle,UCI 数据概述: 本数据集为鲍鱼年龄预测的混合数据集,基于原始数据集和Kaggle竞赛数据集构建。包含两个文件:一个训练集文件和一个测试集文件。数据集旨在通过鲍鱼的物理特征预测其年龄。...
    packageimg