找到2,381个数据集

标签: 数据清洗实践

过滤结果
  • 美国历史黑人学院和大学数据集

    2025年4月14日   

    美国历史黑人学院和大学数据集 数据来源:互联网公开数据 标签:历史黑人学院,大学,教育统计,种族,性别,教育水平,时间序列分析 数据概述:...
    packageimg
  • 塔马兹伊特NLP-庞图恩翻译数据集

    2025年4月14日   

    塔马兹伊特NLP-庞图恩翻译数据集 数据来源:互联网公开数据 标签:塔马兹伊特,语言处理,NLP,翻译,庞图恩,数据集,教育培训 数据概述: 塔马兹伊特NLP-...
    packageimg
  • NIST术语词汇表数据集

    2025年4月14日   

    NIST术语词汇表数据集 数据来源:互联网公开数据 标签:术语词汇, 标准化, NIST, 网络安全, 信息安全, 技术规范, 教育资源, 研究工具 数据概述:...
    packageimg
  • 美国汽车市场数据集

    2025年4月14日   

    美国汽车市场数据集 数据来源:互联网公开数据 标签:汽车市场,美国,汽车价格,数据清洗,数据预处理,网络爬虫,Selenium,BeautifulSoup 数据概述:...
    packageimg
  • 电子邮件垃圾邮件检测数据集2023

    2025年4月14日   

    电子邮件垃圾邮件检测数据集2023 数据来源:互联网公开数据 标签:电子邮件,垃圾邮件,检测,机器学习,Naive Bayes,Random Forest,准确率 数据概述:...
    packageimg
  • 电视剧集详细信息数据集

    2025年4月14日   

    电视剧集详细信息数据集 数据来源:互联网公开数据 标签:电视剧,电视节目,评分,播放时长,首播日期,状态,趋势分析,SQL查询,数据分析,教育培训 数据概述: 本数据集收录了从电视节目数据库TVmaze...
    packageimg
  • Workana自由职业者平台网页抓取数据-教育学习数据集

    2025年4月14日   

    Workana自由职业者平台网页抓取数据-教育学习数据集 数据来源:互联网公开数据 标签:自由职业者,Workana,网页抓取,Selenium,数据分析,教育,Python,技能,平台数据 数据概述:...
    packageimg
  • 验证集-500

    2025年4月14日   

    验证集-500 数据来源:互联网公开数据 标签:验证集,数据集,机器学习,自然语言处理,评估,LLM评估,GPT4 数据概述: 本数据集基于Kaggle上的“wuwenmin/llm-sci-...
    packageimg
  • 学习数据库应用的学生成绩管理系统数据集

    2025年4月14日   

    学习数据库应用的学生成绩管理系统数据集 数据来源:互联网公开数据 标签:学生成绩,数据库,学习,教育,成绩管理,数据分析,Python,SQL 数据概述:...
    packageimg
  • 马拉提语新闻标题数据集1963-2021

    2025年4月14日   

    马拉提语新闻标题数据集1963-2021 数据来源:互联网公开数据 标签:马拉提语,新闻标题,文本分析,自然语言处理,分类模型,机器学习,数据清洗 数据概述: 本数据集包含从马拉提语新闻网站收集的约12000条新闻文章标题。数据集已经经过清洗处理,并分为训练集和测试集,适用于基准测试各类马拉提语文本分类模型。 数据用途概述:...
    packageimg
  • NBME临床患者笔记修正数据集

    2025年4月14日   

    NBME临床患者笔记修正数据集 数据来源:互联网公开数据 标签:临床笔记,患者记录,修正,注释,医学,数据标注,校正 数据概述: 本数据集是基于Kaggle竞赛数据集(https://www.kaggle.com/competitions/nbme-score-clinical-patient-...
    packageimg
  • 数据2022年Goodreads最佳浪漫小说数据集

    2025年4月14日   

    数据2022年Goodreads最佳浪漫小说数据集 数据来源:互联网公开数据 标签:Goodreads,最佳浪漫小说,2022,书评,数据清洗,情感分析 数据概述:...
    packageimg
  • 清洁去噪时间序列数据集

    2025年4月14日   

    清洁去噪时间序列数据集 数据来源:互联网公开数据 标签:时间序列,数据清洗,信号处理,开放通道,去噪,离子切换,数据集 数据概述:...
    packageimg
  • KaggleR语言优秀数据科学笔记分析数据集-2024年4月

    2025年4月14日   

    KaggleR语言优秀数据科学笔记分析数据集-2024年4月 数据来源:互联网公开数据 标签:Kaggle, R语言, 数据科学, 笔记, 排名, 可视化, 数据分析, 学习资源 数据概述:...
    packageimg
  • 中文网站robots-txt数据集

    2025年4月14日   

    中文网站robots-txt数据集 数据来源:互联网公开数据 标签:中文网站,robots.txt,网络爬虫,网站抓取,网络数据,爬虫技术,网站规则 数据概述:...
    packageimg
  • 信用评分分类清理数据集

    2025年4月14日   

    信用评分分类清理数据集 数据来源:互联网公开数据 标签:信用评分,分类,清理数据,金融分析,风险评估,信用风险 数据概述: 本数据集是对原始信用卡分类数据的清理版本,去除了空值和部分格式问题,适用于信用评分分类分析。数据集包含客户的各项财务和信用信息,为金融机构评估信用风险提供了可靠的数据支持。 数据用途概述:...
    packageimg
  • 旁遮普邦巴基斯坦车牌字体数据集

    2025年4月14日   

    旁遮普邦巴基斯坦车牌字体数据集 数据来源:互联网公开数据 标签:车牌识别,字符识别,光学字符识别,机器学习,深度学习,印度,旁遮普邦,车牌字体,文本分类 数据概述: 本数据集包含用于文本识别任务的0-9和a-...
    packageimg
  • 西班牙语评论文本向量化分析数据集

    2025年4月14日   

    西班牙语评论文本向量化分析数据集 数据来源:互联网公开数据 标签:西班牙语,文本分析,自然语言处理,情感分析,机器学习,词袋模型,TF-IDF,停用词,分类 数据概述: 本数据集包含722条西班牙语评论文本,用于二元分类问题。数据集经过文本向量化处理,基于词袋模型(BoW)和TF-...
    packageimg
  • 印度尼西亚短信垃圾信息数据集

    2025年4月14日   

    印度尼西亚短信垃圾信息数据集 数据来源:互联网公开数据 标签:短信,垃圾信息,分类,文本分析,机器学习,印尼语 数据概述: 本数据集来源于https://yudiwbs.wordpress.com/2018/08/05/dataset-klasifikasi-bahasa-indonesia-sms-spam-klasifikasi-teks-...
    packageimg
  • Fitbit用户健康行为数据分析数据集-用户活动与健康指标-时间跨度未知

    2025年4月14日   

    Fitbit用户健康行为数据分析数据集-用户活动与健康指标-时间跨度未知 数据来源:互联网公开数据 标签:Fitbit,健康数据,用户行为,活动追踪,睡眠分析,卡路里消耗,健康指标,数据清洗 数据概述:...
    packageimg