找到2,381个数据集

标签: 数据清洗实践

过滤结果
  • 合成个人身份信息数据集PIISyntheticDataframe-aravilliatchutaram

    2025年4月26日   

    合成个人身份信息数据集PIISyntheticDataframe-aravilliatchutaram 数据来源:互联网公开数据 标签:合成数据,个人身份信息,隐私保护,数据生成,机器学习,数据科学,数据安全,脱敏 数据概述:该数据集包含合成的个人身份信息(PII)数据,旨在用于测试,开发和研究目的,而无需使用真实的用户数据。主要特征如下:...
    packageimg
  • 错误标注泰米尔语语料库数据集Error-annotatedTamilCorpusDataset-neechalkaran

    2025年4月26日   

    错误标注泰米尔语语料库数据集Error-annotatedTamilCorpusDataset-neechalkaran 数据来源:互联网公开数据 标签:自然语言处理,泰米尔语,语料库,错误标注,机器学习,语言技术,文本分析,数据挖掘 数据概述:该数据集包含来自泰米尔语的错误标注语料,记录了泰米尔语文本中的各类错误及其标注信息。主要特征如下:...
    packageimg
  • Langchain-OpenAI教程示例数据集-lorentzyeung

    2025年4月26日   

    Langchain-OpenAI教程示例数据集-lorentzyeung 数据来源:互联网公开数据 标签:Langchain,OpenAI,教程,自然语言处理,机器学习,文本分析,API,开发 数据概述:该数据集是Langchain-OpenAI教程示例的数据集合,主要用于演示和实践Langchain框架与OpenAI API的结合使用。主要特征如下:...
    packageimg
  • 团队独角兽测试集数据集TeamUnicornTestSetDataset-sulavshrestha007

    2025年4月26日   

    团队独角兽测试集数据集TeamUnicornTestSetDataset-sulavshrestha007 数据来源:互联网公开数据 标签:测试数据,数据集,机器学习,模型评估,人工智能,数据验证,算法测试,技术验证 数据概述: 该数据集为团队独角兽项目提供的一组测试数据,用于评估和验证机器学习模型的性能。主要特征如下:...
    packageimg
  • 情感识别不平衡数据集6类6PrimaryImbalancedEmotionDatasets-rahulshelke98

    2025年4月26日   

    情感识别不平衡数据集6类6PrimaryImbalancedEmotionDatasets-rahulshelke98 数据来源:互联网公开数据 标签:情感识别,数据集,不平衡数据,机器学习,自然语言处理,心理学,文本分析,情绪分析...
    packageimg
  • 编码CSV数据集3000样本-15训练轮次-交叉验证-samarpitabhaumik

    2025年4月26日   

    编码CSV数据集3000样本-15训练轮次-交叉验证-samarpitabhaumik 数据来源:互联网公开数据 标签:数据编码,CSV格式,数据集,机器学习,预处理,交叉验证,训练数据,数据科学 数据概述: 该数据集包含经过编码的CSV格式数据,记录了3000个样本的原始数据,每个样本经过15轮的训练和交叉验证。主要特征如下:...
    packageimg
  • KrishNaik五天直播EDA与特征工程数据集KrishNaik5DaysLiveEDAandFeatureEngineeringDataset-shubh48

    2025年4月26日   

    KrishNaik五天直播EDA与特征工程数据集KrishNaik5DaysLiveEDAandFeatureEngineeringDataset-shubh48 数据来源:互联网公开数据 标签:数据科学,EDA,特征工程,机器学习,数据分析,教学资源,直播课程,实践案例 数据概述: 该数据集包含来自Krish...
    packageimg
  • 未清洗数据分析数据集-brianmendieta

    2025年4月26日   

    未清洗数据分析数据集-brianmendieta 数据来源:互联网公开数据 标签:数据清洗,数据质量,异常检测,缺失值处理,数据分析,机器学习,数据预处理,数据挖掘 数据概述:该数据集包含来自多个来源的未清洗数据,记录了原始数据在不同场景下的各种问题。主要特征如下: 时间跨度:数据记录的时间范围不固定,取决于原始数据来源,可能涵盖不同的时间段。...
    packageimg
  • 常见拼写错误纠正数据集-therahasya00

    2025年4月26日   

    常见拼写错误纠正数据集-therahasya00 数据来源:互联网公开数据 标签:拼写纠错,自然语言处理,数据集,文本校正,语言学,机器学习,文本处理,中文 数据概述: 该数据集包含常见的中文拼写错误及其对应的正确词汇。主要特征如下: 时间跨度:数据记录的时间范围无明确限定,持续更新和维护。 地理范围:数据主要涵盖中国大陆地区常用的中文词汇和表达。...
    packageimg
  • Pandas练习数据集PandasPracticeDataset-tabarakalizai

    2025年4月26日   

    Pandas练习数据集PandasPracticeDataset-tabarakalizai 数据来源:互联网公开数据 标签:数据处理,数据分析,数据科学,机器学习,Python,编程练习,数据清洗,统计分析 数据概述:该数据集为Pandas库的练习数据集,包含多种类型的数据,适用于数据处理和分析。主要特征如下:...
    packageimg
  • IDLN临时文件版本1数据集-suryajrrafl

    2025年4月26日   

    IDLN临时文件版本1数据集-suryajrrafl 数据来源:互联网公开数据 标签:图像处理,数据集,临时文件,文件分析,数据挖掘,计算机视觉,文件结构,信息安全 数据概述: 该数据集包含IDLN(图像深度学习网络)产生的临时文件数据,记录了图像处理过程中生成的中间文件和缓存数据。主要特征如下:...
    packageimg
  • 预处理过滤包装数据集PreprocessingFilterWrapperDataset-ushavela

    2025年4月26日   

    预处理过滤包装数据集PreprocessingFilterWrapperDataset-ushavela 数据来源:互联网公开数据 标签:数据预处理,过滤技术,数据集,机器学习,数据处理,数据清洗,算法优化,数据处理工具 数据概述: 该数据集专注于数据预处理和过滤技术的应用,记录了多种数据预处理方法和过滤技术的效果对比。主要特征如下:...
    packageimg
  • 蛋白质序列细胞定位预测数据集

    2025年4月26日   

    蛋白质序列细胞定位预测数据集 数据来源:互联网公开数据 标签:蛋白质,细胞定位,生物信息学,氨基酸序列,机器学习,生物学,蛋白质组学 数据概述:...
    packageimg
  • 预处理测试数据集-lisandramenezes

    2025年4月26日   

    预处理测试数据集-lisandramenezes 数据来源:互联网公开数据 标签:测试数据集,数据预处理,机器学习,数据清洗,数据分析,数据质量,数据评估 数据概述:该数据集包含经过预处理的数据,旨在用于测试数据预处理流程和评估数据质量。主要特征如下: 时间跨度:无明确时间范围,数据集通常为静态数据。 地理范围:无特定地理范围,数据可来源于不同地区。...
    packageimg
  • 印地语验证标记数据集HindiValidationTokensDataset-pranav51286

    2025年4月26日   

    印地语验证标记数据集HindiValidationTokensDataset-pranav51286 数据来源:互联网公开数据 标签:自然语言处理,印地语,标记化,数据集,语言模型,机器学习,文本处理,多语言 数据概述: 该数据集包含来自印地语语料库的验证标记数据,主要用于语言模型训练和评估。主要特征如下:...
    packageimg
  • 模拟数据CSV文件数据集-sakaramtrupthi

    2025年4月26日   

    模拟数据CSV文件数据集-sakaramtrupthi 数据来源:互联网公开数据 标签:模拟数据,CSV,数据集,数据生成,数据分析,数据处理,测试数据,数据建模 数据概述: 该数据集包含CSV格式的模拟数据,用于测试,演示和数据分析等目的。主要特征如下: 时间跨度:数据记录的时间范围不固定,取决于生成数据的具体场景,通常为模拟的特定时间段。...
    packageimg
  • HuggingFace数据集准备指南HuggingFaceDatasetPreparationGuide-mohannadaymansalah

    2025年4月26日   

    HuggingFace数据集准备指南HuggingFaceDatasetPreparationGuide-mohannadaymansalah 数据来源:互联网公开数据 标签:数据集,数据准备,机器学习,数据科学,自然语言处理,人工智能,数据处理,数据标准化 数据概述: 该数据集由 Hugging Face...
    packageimg
  • 实体解析名称与公司数据集EntityResolutionNamevsCompanyDataset-mastmustu

    2025年4月26日   

    实体解析名称与公司数据集EntityResolutionNamevsCompanyDataset-mastmustu 数据来源:互联网公开数据 标签:实体解析,数据集,企业信息,机器学习,自然语言处理,数据匹配,商业智能,信息整合 数据概述: 该数据集包含来自公开企业信息平台的数据,记录了企业名称与企业实体之间的对应关系。主要特征如下:...
    packageimg
  • GermEval18文本分类数据集-thedevastator

    2025年4月22日   

    GermEval18文本分类数据集-thedevastator 数据来源:互联网公开数据 标签:文本分类,情感分析,主题分类,二元分类,多类分类,自然语言处理,机器学习 数据概述:...
    packageimg
  • 训练标签更新数据集TrainLabelsUpdatedDataset-bosbos

    2025年4月26日   

    训练标签更新数据集TrainLabelsUpdatedDataset-bosbos 数据来源:互联网公开数据 标签:数据标签,机器学习,数据集,数据标注,数据更新,数据分类,人工智能,数据科学 数据概述: 该数据集包含更新的训练标签数据,记录了用于机器学习模型的标签信息。主要特征如下: 时间跨度:数据记录的时间范围不明确,可能为近期更新。...
    packageimg