找到2,381个数据集

标签: 数据清洗实践

过滤结果
  • 文本标注代码数据集TextAnnotationCodeDataset-jafarjon

    2025年5月29日   

    文本标注代码数据集TextAnnotationCodeDataset-jafarjon 数据来源:互联网公开数据 标签:文本标注, 代码分析, 数据清洗, 自然语言处理, 机器学习, 数据集构建, 文本处理, 代码示例 数据概述: 该数据集包含来自网络公开的数据,记录了与文本标注相关的代码示例。主要特征如下:...
    packageimg
  • 样本优化与混合数据集BetterSampleBlendDataset-gopisaran

    2025年5月29日   

    样本优化与混合数据集BetterSampleBlendDataset-gopisaran 数据来源:互联网公开数据 标签:数据集,样本优化,数据混合,机器学习,数据科学,统计分析,模型训练,算法改进 数据概述: 该数据集专注于样本优化与混合技术,记录了通过多种方法进行样本调整和组合后的数据。主要特征如下:...
    packageimg
  • 命名实体识别标注数据集NamedEntityRecognitionAnnotationDataset-bajajra

    2025年5月29日   

    命名实体识别标注数据集NamedEntityRecognitionAnnotationDataset-bajajra 数据来源:互联网公开数据 标签:命名实体识别, 自然语言处理, 文本标注, 序列标注, 机器学习, 深度学习, 语料库, BERT 数据概述:...
    packageimg
  • 导航数据清洗数据集NavDataCleanedDataset-dewashyadubey

    2025年5月29日   

    导航数据清洗数据集NavDataCleanedDataset-dewashyadubey 数据来源:互联网公开数据 标签:导航数据,数据清洗,数据集,交通分析,机器学习,位置服务,地理信息,数据处理 数据概述: 该数据集包含经过清洗和标准化的导航数据,记录了车辆或移动设备的导航轨迹信息。主要特征如下:...
    packageimg
  • 个人信息识别与脱敏数据处理数据集PIIExtrasDataset-stochoshi

    2025年5月29日   

    个人信息识别与脱敏数据处理数据集PIIExtrasDataset-stochoshi 数据来源:互联网公开数据 标签:数据隐私,个人信息,脱敏处理,数据集,机器学习,自然语言处理,数据安全,信息识别 数据概述: 该数据集包含来自多个来源的个人信息数据,记录了各类文本中个人身份信息(PII)的识别与脱敏处理。主要特征如下:...
    packageimg
  • 数据库SQL语句生成与解析数据集DatabaseSQLGenerationandParsingDataset-saadaouiossama

    2025年5月29日   

    数据库SQL语句生成与解析数据集DatabaseSQLGenerationandParsingDataset-saadaouiossama 数据来源:互联网公开数据 标签:SQL, 数据库, 自然语言处理, 文本生成, 语义理解, 数据分析, 机器学习, 数据库查询 数据概述:...
    packageimg
  • 清洗后的电子邮件数据集-ashishgoraniya

    2025年5月29日   

    清洗后的电子邮件数据集-ashishgoraniya 数据来源:互联网公开数据 标签:电子邮件,数据集,文本分析,自然语言处理,垃圾邮件检测,信息检索,情感分析,数据清洗 数据概述: 该数据集包含了经过清洗的电子邮件数据,主要用于文本分析和自然语言处理任务。主要特征如下: 时间跨度:数据记录的时间跨度不明确,取决于原始邮件的时间范围。...
    packageimg
  • 法律文本分词数据集BKAILegalCorpusSegmentedDataset-lamtruong1594

    2025年5月29日   

    法律文本分词数据集BKAILegalCorpusSegmentedDataset-lamtruong1594 数据来源:互联网公开数据 标签:法律文本,数据集,分词,自然语言处理,文本分析,机器学习,法律研究,语义理解 数据概述: 该数据集包含来自BKAI机构提供的法律文本数据,记录了已分词的法律文本内容。主要特征如下:...
    packageimg
  • 新数据库数据集NewDBDataset-buvanaar

    2025年5月29日   

    新数据库数据集NewDBDataset-buvanaar 数据来源:互联网公开数据 标签:数据库,数据集,信息管理,数据挖掘,数据分析,信息技术,结构化数据,信息系统 数据概述: 该数据集包含来自新数据库的数据,记录了多种结构化数据信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2023年。...
    packageimg
  • 功能特征工程数据集Func-FeaturesDataset-cxk858

    2025年5月29日   

    功能特征工程数据集Func-FeaturesDataset-cxk858 数据来源:互联网公开数据 标签:特征工程,机器学习,数据集,数据分析,算法,函数,变量,Python 数据概述: 该数据集包含了用于机器学习模型构建的功能特征工程数据,记录了各种函数和变量的计算结果。主要特征如下: 时间跨度: 数据记录的时间范围不确定,取决于生成数据的脚本。...
    packageimg
  • Keras开源代码数据集KerasOpen-SourceCodeDataset-zzdyyy

    2025年5月29日   

    Keras开源代码数据集KerasOpen-SourceCodeDataset-zzdyyy 数据来源:互联网公开数据 标签:深度学习,Keras,开源代码,数据集,机器学习,神经网络,软件开发,人工智能 数据概述: 该数据集包含来自Keras开源项目的代码数据,记录了Keras框架中用于深度学习的模型和算法的实现代码。主要特征如下:...
    packageimg
  • 图像分类噪声标签数据集ImageClassificationNoisyLabelDataset-roneoz

    2025年5月29日   

    图像分类噪声标签数据集ImageClassificationNoisyLabelDataset-roneoz 数据来源:互联网公开数据 标签:图像识别,噪声标签,图像分类,深度学习,计算机视觉,数据集,机器学习,模型训练 数据概述:...
    packageimg
  • 论文验证数据集ValidationDatasetforThesis-syedahsanalinaqvi123

    2025年5月29日   

    论文验证数据集ValidationDatasetforThesis-syedahsanalinaqvi123 数据来源:互联网公开数据 标签:学术研究,数据验证,数据集,论文支持,机器学习,数据科学,模型评估,研究领域 数据概述: 该数据集为学术论文验证任务提供支持,记录了用于模型验证和算法评估的数据样本。主要特征如下:...
    packageimg
  • 基础数据清洗数据集-jianbinchenuc

    2025年5月29日   

    基础数据清洗数据集-jianbinchenuc 数据来源:互联网公开数据 标签:数据清洗,数据质量,数据集,数据预处理,数据分析,统计学,机器学习,数据科学 数据概述: 该数据集包含了用于基础数据清洗的各种数据,记录了不同类型数据中常见的脏数据和缺失数据。主要特征如下: 时间跨度:数据记录的时间范围不限,涵盖了不同时间段的数据。...
    packageimg
  • 历史申请数据清洗数据集CleanPreviousApplicationCSVDataset-duynguyen2

    2025年5月29日   

    历史申请数据清洗数据集CleanPreviousApplicationCSVDataset-duynguyen2 数据来源:互联网公开数据 标签:金融业,申请数据,数据清洗,数据分析,机器学习,信用评估,数据集,风险管理 数据概述: 该数据集包含经过清洗的历史申请数据,记录了个人或企业的贷款申请信息。主要特征如下:...
    packageimg
  • 生物医学信号处理伪标签数据集BMSPseudoLabelsLB074Dataset-kfujikawa

    2025年5月29日   

    生物医学信号处理伪标签数据集BMSPseudoLabelsLB074Dataset-kfujikawa 数据来源:互联网公开数据 标签:生物医学,信号处理,伪标签,数据集,机器学习,医学研究,人工智能,数据分析 数据概述: 该数据集包含来自生物医学信号处理领域的伪标签数据,记录了用于训练和验证机器学习模型的伪标签信息。主要特征如下:...
    packageimg
  • 测试数据集ClearTestDataFinalDataset-its4iris

    2025年5月29日   

    测试数据集ClearTestDataFinalDataset-its4iris 数据来源:互联网公开数据 标签:测试数据,数据集,数据验证,数据清洗,机器学习,数据分析,数据处理,质量控制 数据概述: 该数据集包含用于测试和验证目的的标准化数据,主要用于数据清洗、模型测试和数据验证等任务。主要特征如下:...
    packageimg
  • 越南语文本纠错数据集VietnameseTextErrorCorrectionDataset-haphan68

    2025年5月29日   

    越南语文本纠错数据集VietnameseTextErrorCorrectionDataset-haphan68 数据来源:互联网公开数据 标签:越南语, 文本纠错, 自然语言处理, 语言模型, 文本校对, 数据清洗, 机器翻译, 拼写纠错 数据概述: 该数据集包含越南语文本的错误文本及其对应的正确文本,用于越南语文本的纠错任务。主要特征如下:...
    packageimg
  • 图像识别预测标签提交数据集ImageRecognitionPredictionLabelSubmission-scaomath

    2025年5月29日   

    图像识别预测标签提交数据集ImageRecognitionPredictionLabelSubmission-scaomath 数据来源:互联网公开数据 标签:图像识别, 深度学习, 图像分类, 模型预测, 机器学习, 计算机视觉, 模型评估, 提交文件 数据概述: 该数据集包含一个提交文件,用于图像识别任务的预测结果。主要特征如下:...
    packageimg
  • 邮件清洗数据集EmailCleanedDatasets-ashishgoraniya

    2025年5月29日   

    邮件清洗数据集EmailCleanedDatasets-ashishgoraniya 数据来源:互联网公开数据 标签:邮件数据,数据清洗,文本分析,自然语言处理,机器学习,垃圾邮件检测,数据预处理,电子邮件 数据概述: 该数据集包含经过清洗处理的电子邮件数据,主要用于文本分析、垃圾邮件检测等研究。主要特征如下:...
    packageimg