找到2,381个数据集

标签: 数据清洗实践

过滤结果
  • YouTube评论分类与垃圾评论识别数据集YouTubeSpamClassifiedCommentsDataset-goneee

    2025年4月22日   

    YouTube评论分类与垃圾评论识别数据集YouTubeSpamClassifiedCommentsDataset-goneee 数据来源:互联网公开数据 标签:社交媒体,评论分析,数据集,垃圾评论,机器学习,自然语言处理,文本分类,信息过滤 数据概述:...
    packageimg
  • 印度城市房价数据集-不同物业类型-sambhavsg

    2025年4月22日   

    印度城市房价数据集-不同物业类型-sambhavsg 数据来源:互联网公开数据 标签:房价,印度城市,物业类型,房地产,数据分析,预测模型,教育,数据清理 数据概述:...
    packageimg
  • 乳胶口罩攻击面部识别视频数据集-2023-unidatapro

    2025年4月22日   

    乳胶口罩攻击面部识别视频数据集-2023-unidatapro 数据来源:互联网公开数据 标签:乳胶口罩,面部识别,防欺诈,生物识别,活体检测,iBeta认证,安全系统,数据集 数据概述:...
    packageimg
  • 预处理后的样本数据Post-PreprocessedDataSample数据集-brandonleetsai

    2025年4月22日   

    预处理后的样本数据Post-PreprocessedDataSample数据集-brandonleetsai 数据来源:互联网公开数据 标签:数据预处理,样本数据,数据清洗,数据分析,机器学习,数据科学,数据质量,特征工程 数据概述: 该数据集包含经过预处理的样本数据,旨在展示数据预处理流程的效果和为后续分析提供基础。主要特征如下:...
    packageimg
  • 英印机器翻译练习数据集-arunmohan003

    2025年4月22日   

    英印机器翻译练习数据集-arunmohan003 数据来源:互联网公开数据 标签:机器翻译,英印翻译,语言数据,练习数据,自然语言处理,NLP,样本数据 数据概述:...
    packageimg
  • anno-data标注数据集Anno-DataLabelingDataset-naumangujjar26

    2025年4月22日   

    anno-data标注数据集Anno-DataLabelingDataset-naumangujjar26 数据来源:互联网公开数据 标签:标注数据,数据集,机器学习,数据挖掘,人工智能,自然语言处理,图像识别,计算机视觉 数据概述: 该数据集包含来自anno-data平台的标注数据,记录了各类数据样本的标注信息。主要特征如下:...
    packageimg
  • 命名实体识别原始数据集NamedEntityRecognitionRawDataDataset-kiruthigaa

    2025年4月22日   

    命名实体识别原始数据集NamedEntityRecognitionRawDataDataset-kiruthigaa 数据来源:互联网公开数据 标签:命名实体识别,数据集,自然语言处理,文本分析,机器学习,人工智能,语言学,文本挖掘 数据概述:该数据集包含来自多个来源的原始文本数据,记录了用于命名实体识别的任务。主要特征如下:...
    packageimg
  • SQL学习入门实践数据库构建数据集-alexandresantosal91

    2025年4月22日   

    SQL学习入门实践数据库构建数据集-alexandresantosal91 数据来源:互联网公开数据 标签:SQL,数据库,学习,入门,实践,教程,Jerry Strazzeri,YouTube,SQL Saia do ZERO 数据概述: 本数据集是基于YouTube频道"Jerry Strazzeri"的"SQL Saia do ZERO em...
    packageimg
  • 智能手机市场产品信息及用户评价数据集-difuze

    2025年4月22日   

    智能手机市场产品信息及用户评价数据集-difuze 数据来源:互联网公开数据 标签:智能手机, 手机市场, 产品信息, 用户评价, 市场分析, 数据清洗, 移动设备 数据概述:...
    packageimg
  • 罗马化孟加拉语情感分析数据集-2023-mobassir

    2025年4月22日   

    罗马化孟加拉语情感分析数据集-2023-mobassir 数据来源:互联网公开数据 标签:罗马化孟加拉语,情感分析,社交媒体,博客,新闻评论,Sentiment Analysis,数据集 数据概述: 本数据集包含300,000条罗马化孟加拉语(Banglish)句子,例如将“আমার দেশ”写作“amar...
    packageimg
  • 数据分析与可视化任务数据集Tarea-02DataAnalysisandVisualizationDataset-joselbarrales

    2025年4月22日   

    数据分析与可视化任务数据集Tarea-02DataAnalysisandVisualizationDataset-joselbarrales 数据来源:互联网公开数据 标签:数据分析,数据可视化,数据集,机器学习,商业智能,统计建模,信息挖掘,教育研究 数据概述:...
    packageimg
  • 法律数据预处理数据集PreprocessingLegalDataDataset-philanpersonal

    2025年4月22日   

    法律数据预处理数据集PreprocessingLegalDataDataset-philanpersonal 数据来源:互联网公开数据 标签:法律数据,预处理,数据集,文本分析,自然语言处理,法律研究,数据清洗,法律文本 数据概述: 该数据集包含经过预处理的法律文本数据,适用于法律研究,文本分析和自然语言处理等任务。主要特征如下:...
    packageimg
  • DEFCON31人工智能村CTF竞赛数据集2023-jbomitchell

    2025年4月22日   

    DEFCON31人工智能村CTF竞赛数据集2023-jbomitchell 数据来源:互联网公开数据 标签:CTF,DEFCON,人工智能,网络安全,竞赛,挑战,安全,技术,挑战赛 数据概述: 本数据集包含用于2023年DEFCON31大会人工智能村(AI Village)举办的捕获旗帜(Capture the Flag,...
    packageimg
  • Spacy测试数据集SpacyTestDataset-hhhurenyuan

    2025年4月22日   

    Spacy测试数据集SpacyTestDataset-hhhurenyuan 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,机器学习,NLP,文本分类,语言模型,人工智能 数据概述: 该数据集为 Spacy 项目的测试数据集,主要记录了用于自然语言处理任务的文本数据。主要特征如下: 时间跨度:数据记录的时间范围未知。...
    packageimg
  • 迷你数据集MiniDataset-sugardevs

    2025年4月22日   

    迷你数据集MiniDataset-sugardevs 数据来源:互联网公开数据 标签:数据集,样本数据,数据分析,基础数据,统计学,教育研究,数据处理,数据科学 数据概述: 该数据集包含来自互联网公开渠道的样本数据,记录了基础数据集的典型特征。主要特征如下: 时间跨度:数据记录的时间范围从近年到当前。...
    packageimg
  • 蛋白质序列特征预测多任务基准数据集-djokester

    2025年4月22日   

    蛋白质序列特征预测多任务基准数据集-djokester 数据来源:互联网公开数据 标签:蛋白质,生物信息学,机器学习,结构预测,功能预测,PTM,二元分类,多分类,回归分析 数据概述:...
    packageimg
  • 临床综合征疾病文档标注数据集2023-muhammadimran112233

    2025年4月22日   

    临床综合征疾病文档标注数据集2023-muhammadimran112233 数据来源:互联网公开数据 标签:临床文档,综合征,疾病,医学,标注,文本数据,神经学,放射学,出院总结,内科,消化内科 数据概述:...
    packageimg
  • 用户提交测试数据集SubmissionTestDataset-rajesh1992

    2025年4月22日   

    用户提交测试数据集SubmissionTestDataset-rajesh1992 数据来源:互联网公开数据 标签:测试数据集,提交数据,机器学习,数据分析,模型评估,数据清洗,样本数据,实验 数据概述: 该数据集包含用于测试用户提交的机器学习模型的数据,旨在评估模型在不同任务上的表现。主要特征如下:...
    packageimg
  • Pandas练习数据集DatasetforPandasPractice-fazela

    2025年4月22日   

    Pandas练习数据集DatasetforPandasPractice-fazela 数据来源:互联网公开数据 标签:数据分析,Pandas,练习数据,数据处理,数据科学,机器学习,教育资源,入门教程 数据概述: 该数据集为Pandas练习而设计,包含适合初学者和进阶用户练习的数据操作和分析任务。主要特征如下:...
    packageimg
  • CSV格式未标注数据集CSVUnlabelledDataset-kivlovski

    2025年4月22日   

    CSV格式未标注数据集CSVUnlabelledDataset-kivlovski 数据来源:互联网公开数据 标签:数据集,CSV格式,未标注数据,数据处理,机器学习,数据挖掘,数据科学,数据预处理 数据概述: 该数据集包含来自公开来源的CSV格式数据,记录了未标注的原始数据。主要特征如下: 时间跨度:数据记录的时间范围不明确,具体时间信息未提供。...
    packageimg