找到2,381个数据集

标签: 数据清洗实践

过滤结果
  • 推特情感分析增强数据集-推文情感与文本增强-mks2192

    2025年4月23日   

    推特情感分析增强数据集-推文情感与文本增强-mks2192 数据来源:互联网公开数据 标签:推特,情感分析,文本挖掘,自然语言处理,数据增强,情感分类,文本数据 数据概述:...
    packageimg
  • 科学声明事实核查数据集-2022-thedevastator

    2025年4月23日   

    科学声明事实核查数据集-2022-thedevastator 数据来源:互联网公开数据 标签:科学声明,事实核查,信任度分析,情感分析,科学传播,数据标注,自然语言处理 数据概述:...
    packageimg
  • 越南语词汇与语料数据集Viettat-ThanhnguVietnameseVocabularyandCorpusDataset-duykhnhavx

    2025年4月22日   

    越南语词汇与语料数据集Viettat-ThanhnguVietnameseVocabularyandCorpusDataset-duykhnhavx 数据来源:互联网公开数据 标签:语言学研究,越南语,词汇分析,语料库,自然语言处理,文本挖掘,语言技术,数据集 数据概述:...
    packageimg
  • 零售数据管道构建数据集BuildingaRetailDataPipelineDataset-abdelazizsami

    2025年4月22日   

    零售数据管道构建数据集BuildingaRetailDataPipelineDataset-abdelazizsami 数据来源:互联网公开数据 标签:零售业,数据管道,数据集,数据工程,销售分析,机器学习,ETL,BI 数据概述: 该数据集提供了构建零售数据管道所需的数据,模拟了零售业务中的各种数据来源和场景。主要特征如下:...
    packageimg
  • 脑肿瘤患者诊断数据集匿名化-MITWPU大学TexephyrDatathon竞赛-sooryaprakash12

    2025年4月22日   

    脑肿瘤患者诊断数据集匿名化-MITWPU大学TexephyrDatathon竞赛-sooryaprakash12 数据来源:互联网公开数据 标签:脑肿瘤,医学影像,诊断,机器学习,数据清洗,缺失值,分类,医疗 数据概述: 本数据集为MIT WPU大学Texephyr...
    packageimg
  • 机器学习入门数据集LearnMLDatasets-niharkondam

    2025年4月22日   

    机器学习入门数据集LearnMLDatasets-niharkondam 数据来源:互联网公开数据 标签:机器学习,数据集,入门,教育,数据分析,学习资源,编程,人工智能 数据概述:该数据集由多个机器学习入门教程和课程提供,包含了用于教学和入门练习的数据集。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2023年。...
    packageimg
  • 未合并的CSV文件数据集-didarko

    2025年4月22日   

    未合并的CSV文件数据集-didarko 数据来源:互联网公开数据 标签:CSV文件,数据处理,数据分析,数据集,数据融合,数据清洗,数据整合,数据预处理 数据概述: 该数据集包含多个未合并的CSV文件,记录了各种不同的数据。主要特征如下: 时间跨度: 数据记录的时间范围取决于各个CSV文件中的数据,没有统一的时间范围。 地理范围:...
    packageimg
  • 美国政府开放数据标题数据集CKANData-govTitlesDataset-saralafia

    2025年4月22日   

    美国政府开放数据标题数据集CKANData-govTitlesDataset-saralafia 数据来源:互联网公开数据 标签:政府数据,开放数据,数据集,标题分析,文本挖掘,数据清洗,信息检索,公共服务 数据概述:...
    packageimg
  • 测试数据转换数据集TestDataTransformerDataset-coralsea154

    2025年4月22日   

    测试数据转换数据集TestDataTransformerDataset-coralsea154 数据来源:互联网公开数据 标签:测试数据,数据转换,数据集,机器学习,数据分析,数据预处理,人工智能,数据科学 数据概述:该数据集包含来自测试数据转换项目的数据,记录了不同数据格式之间转换的详细信息。主要特征如下:...
    packageimg
  • 计算机科学155课程项目1训练特征数据集CS155Proj1TrainFeaturesDataset-dannycollinson12

    2025年4月22日   

    计算机科学155课程项目1训练特征数据集CS155Proj1TrainFeaturesDataset-dannycollinson12 数据来源:互联网公开数据 标签:计算机科学,课程项目,训练数据,数据集,特征工程,机器学习,学术研究,教育技术 数据概述: 该数据集来源于计算机科学155课程的项目1,包含了用于训练模型的特征数据。主要特征如下:...
    packageimg
  • 数据整理与清洗项目数据集DataWranglingProjectDataset-anuragjain3

    2025年4月22日   

    数据整理与清洗项目数据集DataWranglingProjectDataset-anuragjain3 数据来源:互联网公开数据 标签:数据整理,数据清洗,数据集,数据处理,数据分析,数据科学,机器学习,数据工程 数据概述: 该数据集来自一个数据整理与清洗项目,主要记录了原始数据的整理,清洗和处理过程。主要特征如下:...
    packageimg
  • 第四天数据分割数据集-hasnain3

    2025年4月22日   

    第四天数据分割数据集-hasnain3 数据来源:互联网公开数据 标签:数据分割,机器学习,数据集,数据预处理,训练集,测试集,验证集,数据分析 数据概述: 该数据集包含经过分割的数据,用于机器学习模型的训练,验证和测试。主要特征如下: 时间跨度:数据记录的时间范围取决于原始数据集,通常不涉及时间序列特征。...
    packageimg
  • 模糊匹配基准数据集FuzzyMatchingBenchmarkDataset-shahrukhkhan

    2025年4月22日   

    模糊匹配基准数据集FuzzyMatchingBenchmarkDataset-shahrukhkhan 数据来源:互联网公开数据 标签:模糊匹配,数据集,基准测试,文本分析,自然语言处理,机器学习,信息检索,数据清洗 数据概述: 该数据集包含来自多个来源的文本数据,用于评估和比较不同模糊匹配算法的性能。主要特征如下:...
    packageimg
  • IEEE论文摘要与关键词数据集

    2025年4月22日   

    IEEE论文摘要与关键词数据集 数据来源:互联网公开数据 标签:IEEE论文,摘要,关键词,多标签分类,自然语言处理,科学研究 数据概述:...
    packageimg
  • 探索性数据分析数据集-akalyasubramanian

    2025年4月22日   

    探索性数据分析数据集-akalyasubramanian 数据来源:互联网公开数据 标签:数据分析,探索性数据分析,数据集,数据可视化,统计分析,机器学习,数据预处理,Python 数据概述: 该数据集包含用于探索性数据分析的多种数据类型和结构,旨在帮助用户熟悉数据分析流程和技术。主要特征如下:...
    packageimg
  • 虚假人脸视频数据集

    2025年4月22日   

    虚假人脸视频数据集 数据来源:互联网公开数据 标签:虚假人脸,深度伪造,视频识别,计算机视觉,机器学习,数据清洗,模型训练,算法优化 数据概述: 本数据集是一个经过优化的虚假人脸视频数据集,由Deepfake...
    packageimg
  • 标签文件数据集LabelsFileDataset-phamdongdongk16hcm

    2025年4月22日   

    标签文件数据集LabelsFileDataset-phamdongdongk16hcm 数据来源:互联网公开数据 标签:数据标注,数据集,机器学习,图像识别,自然语言处理,数据管理,数据科学,人工智能 数据概述: 该数据集包含来自多个来源的标签文件数据,记录了用于机器学习和人工智能模型的标注信息。主要特征如下:...
    packageimg
  • 文件输出数据集OutputdropFilesDataset-prshch

    2025年4月22日   

    文件输出数据集OutputdropFilesDataset-prshch 数据来源:互联网公开数据 标签:文件处理,数据集,数据格式,数据存储,数据处理,数据管理,云计算,信息技术 数据概述:该数据集包含来自文件输出系统的数据,记录了各类文件的输出和存储信息。主要特征如下: 时间跨度:数据记录的时间范围从2020年到2023年。...
    packageimg
  • 数据30天机器学习竞赛LightGBM预测数据集-noulan

    2025年4月22日   

    30天机器学习竞赛LightGBM预测数据集-noulan 数据来源:互联网公开数据 标签:机器学习,竞赛,LightGBM,预测模型,数据集,Kaggle,数据科学 数据概述:...
    packageimg
  • 训练与测试数据集及模型集合DatasetofTrainandTestSetsandModels-thiagobluhm

    2025年4月22日   

    训练与测试数据集及模型集合DatasetofTrainandTestSetsandModels-thiagobluhm 数据来源:互联网公开数据 标签:数据集,机器学习,模型训练,测试数据,数据分割,算法评估,数据科学,人工智能 数据概述: 该数据集包含用于机器学习模型训练和测试的数据集及预训练模型集合。主要特征如下:...
    packageimg