找到2,381个数据集

标签: 数据清洗实践

过滤结果
  • 命名实体识别自定义数据集NamedEntityRecognitionCustomDataset-pranjan02

    2025年4月24日   

    命名实体识别自定义数据集NamedEntityRecognitionCustomDataset-pranjan02 数据来源:互联网公开数据 标签:命名实体识别,数据集,自然语言处理,文本分析,机器学习,深度学习,文本挖掘,人工智能 数据概述:该数据集包含来自多个来源的自定义文本数据,用于训练和评估命名实体识别(NER)模型。主要特征如下:...
    packageimg
  • 关系数据库数据帧数据集RDSDataFrameDataset-mrfrancois

    2025年4月24日   

    关系数据库数据帧数据集RDSDataFrameDataset-mrfrancois 数据来源:互联网公开数据 标签:数据库,数据帧,数据集,数据管理,SQL,数据分析,数据转换,数据科学 数据概述: 该数据集包含来自关系型数据库(RDS)的数据,记录了数据库中的数据帧信息。主要特征如下:...
    packageimg
  • 句子改写与同义表达数据集PAWSParaphrasingDataset-srinu513

    2025年4月24日   

    句子改写与同义表达数据集PAWSParaphrasingDataset-srinu513 数据来源:互联网公开数据 标签:自然语言处理,文本改写,机器学习,语义分析,语言模型,NLP,数据集,语义相似度 数据概述:该数据集包含来自PAWS项目(Paraphrase Adversarial...
    packageimg
  • 图像有效性验证数据集-sxntox

    2025年4月24日   

    图像有效性验证数据集-sxntox 数据来源:互联网公开数据 标签:图像处理,数据集,图像质量,计算机视觉,图像分析,机器学习,图像识别,数据清洗 数据概述: 该数据集包含了一系列图像,用于验证图像的有效性,即图像是否完整,清晰,无损坏。主要特征如下: 时间跨度: 数据记录的时间范围不限,涵盖了多种图像生成和采集时间。 地理范围:...
    packageimg
  • 数据准备与预处理数据集PreparationDataDataset-yennhiyexhin

    2025年4月24日   

    数据准备与预处理数据集PreparationDataDataset-yennhiyexhin 数据来源:互联网公开数据 标签:数据预处理,数据清洗,数据集,机器学习,数据分析,数据挖掘,数据科学,统计学 数据概述: 该数据集包含来自多个来源的数据准备与预处理过程的记录,主要用于展示和教学数据清洗,转换和准备的步骤。主要特征如下:...
    packageimg
  • 简化虚假新闻数据集

    2025年4月24日   

    简化虚假新闻数据集 数据来源:互联网公开数据 标签:虚假新闻,文本分类,NLP,二分类问题,数据清洗,特征提取,新闻真实性分析 数据概述: 本数据集是虚假新闻与真实新闻数据集的简化版本,旨在为文本分类任务提供训练集。数据集已标注,包含真实新闻与虚假新闻的文本内容,适合作为自然语言处理(NLP)任务的基础数据。数据集经过初步处理,确保数据质量与一致性。...
    packageimg
  • Steam游戏商店游戏信息原始数据集

    2025年4月24日   

    Steam游戏商店游戏信息原始数据集 数据来源:互联网公开数据 标签:Steam,游戏,商店,数据清洗,游戏数据,价格,评级,发行商,开发者 数据概述: 本数据集包含从Steam游戏商店抓取的原始数据,数据来源于Steam和SteamSpy...
    packageimg
  • 数值数据集用于练习填补缺失值NumDatasetforPracticeFillingMissingValues-fadool

    2025年4月24日   

    数值数据集用于练习填补缺失值NumDatasetforPracticeFillingMissingValues-fadool 数据来源:互联网公开数据 标签:数值数据集,缺失值处理,数据清洗,数据分析,机器学习,数据科学,统计学,数据预处理 数据概述:该数据集包含来自多个来源的数值数据,适用于练习和学习填补缺失值的方法和技巧。主要特征如下:...
    packageimg
  • SparkDataFrame操作数据集DatasetforSparkDFOperations-akalyasubramanian

    2025年4月24日   

    SparkDataFrame操作数据集DatasetforSparkDFOperations-akalyasubramanian 数据来源:互联网公开数据 标签:数据处理,Spark,DataFrame,大数据,数据转换,机器学习,数据分析,云计算 数据概述: 该数据集包含用于Spark...
    packageimg
  • NASA官网服务器日志数据集

    2025年4月24日   

    NASA官网服务器日志数据集 数据来源:互联网公开数据 标签:NASA官网,服务器日志,网站访问,数据探索,SQL分析,时间序列,数据缺失 数据概述:...
    packageimg
  • Pandas库数据分析实战数据集-jidhunkmadhu

    2025年4月24日   

    Pandas库数据分析实战数据集-jidhunkmadhu 数据来源:互联网公开数据 标签:数据分析,Pandas,Python,数据处理,数据可视化,机器学习,编程,数据集 数据概述: 该数据集包含用于Pandas库数据分析实战的各种数据,涵盖了多种数据类型和应用场景。主要特征如下: 时间跨度:根据不同数据源而异,可能包括历史数据和实时数据。...
    packageimg
  • 社交媒体评论净化数据集CommentsCleaningDataset-banbeipi

    2025年4月24日   

    社交媒体评论净化数据集CommentsCleaningDataset-banbeipi 数据来源:互联网公开数据 标签:文本分析,自然语言处理,数据集,情感分析,文本清洗,机器学习,社交媒体,评论 数据概述: 该数据集包含来自社交媒体平台的评论数据,主要用于文本清洗和情感分析研究。主要特征如下:...
    packageimg
  • 未清洗的学习数据集DataNotCleanforLearningDataset-qannan

    2025年4月24日   

    未清洗的学习数据集DataNotCleanforLearningDataset-qannan 数据来源:互联网公开数据 标签:数据集,机器学习,数据清洗,数据预处理,教育研究,数据分析,人工智能,学术资源 数据概述:该数据集包含来自公开来源的学习相关数据,记录了原始且未经过清洗处理的样本信息。主要特征如下:...
    packageimg
  • 合同条款分析数据集CUAD-Master-ClausesDataset-akashrai1701

    2025年4月24日   

    合同条款分析数据集CUAD-Master-ClausesDataset-akashrai1701 数据来源:互联网公开数据 标签:法律文本,合同分析,数据集,自然语言处理,机器学习,法律研究,文本分类,智能合约 数据概述: 该数据集包含来自 CUAD(Contract Understanding...
    packageimg
  • 情绪识别不平衡数据集V26-EmotionImbalancedDatasetV2-rahulshelke98

    2025年4月24日   

    情绪识别不平衡数据集V26-EmotionImbalancedDatasetV2-rahulshelke98 数据来源:互联网公开数据 标签:情绪识别,数据集,情感分析,机器学习,自然语言处理,文本分类,情感不平衡,多类别分类 数据概述: 该数据集是用于情绪识别任务的文本数据集,重点关注情感类别的不平衡问题。主要特征如下: 时间跨度:...
    packageimg
  • 音乐流行度预测与缺失值填充数据集CSVFillingMissingValuesSongPopularityDataset-dienhoa

    2025年4月24日   

    音乐流行度预测与缺失值填充数据集CSVFillingMissingValuesSongPopularityDataset-dienhoa 数据来源:互联网公开数据 标签:音乐流行度,数据集,缺失值填充,数据清洗,流行音乐,机器学习,音乐分析,数据分析 数据概述:...
    packageimg
  • 国家别名对照数据集-andreneedsambulance

    2025年4月24日   

    国家别名对照数据集-andreneedsambulance 数据来源:互联网公开数据 标签:国家,别名,地理,数据,信息检索,自然语言处理,地图绘制,数据清洗 数据概述: 该数据集包含了国家及其常用别名的数据,旨在提供国家名称和常用替代称呼之间的映射关系。主要特征如下: 时间跨度:数据持续更新,涵盖了不同时期和语境下的国家别名。...
    packageimg
  • 词汇数据集Lexicon-CleanDataset-jvmchik

    2025年4月24日   

    词汇数据集Lexicon-CleanDataset-jvmchik 数据来源:互联网公开数据 标签:语言学,词汇学,数据集,自然语言处理,文本分析,教育研究,数据清洗,语言资源 数据概述: 该数据集包含经过清洗和标准化的词汇数据,记录了多种语言的词汇信息。主要特征如下: 时间跨度:数据记录的时间范围不明确,主要为静态词汇数据。...
    packageimg
  • Pandas项目数据分析数据集-farshidhesami

    2025年4月24日   

    Pandas项目数据分析数据集-farshidhesami 数据来源:互联网公开数据 标签:数据分析,Pandas,Python,数据处理,数据集,数据清洗,数据探索,机器学习 数据概述: 该数据集包含用于 Pandas 项目的数据,记录了各种数据分析任务和数据处理的示例。主要特征如下: 时间跨度:数据记录的时间范围不固定,取决于具体的项目和数据源。...
    packageimg
  • 机器学习入门学习数据集AprendizadodeMáquinaparaIniciantesDataset-mos3santos

    2025年4月24日   

    机器学习入门学习数据集AprendizadodeMáquinaparaIniciantesDataset-mos3santos 数据来源:互联网公开数据 标签:机器学习,数据集,教育,入门,算法,编程,数据分析,人工智能 数据概述: 该数据集专为机器学习初学者设计,包含基础的机器学习算法和编程示例,主要特征如下:...
    packageimg