找到2,381个数据集

标签: 数据清洗实践

过滤结果
  • 提示注入攻击实例数据集

    2025年4月20日   

    提示注入攻击实例数据集 数据来源:互联网公开数据 标签:提示注入,自然语言处理,网络安全,机器学习,对抗攻击,数据安全 数据概述: 本数据集汇集了从Hugging...
    packageimg
  • iBeta二级认证人脸活体检测与欺骗攻击数据集

    2025年4月20日   

    iBeta二级认证人脸活体检测与欺骗攻击数据集 数据来源:互联网公开数据 标签:生物识别,人脸识别,活体检测,欺骗攻击,安全认证,iBeta,ISO 30107-3,机器学习,人工智能 数据概述:...
    packageimg
  • 利物浦大学离子开关竞赛无漂移信号处理数据集应用卡尔曼滤波器1963-2021

    2025年4月20日   

    利物浦大学离子开关竞赛无漂移信号处理数据集应用卡尔曼滤波器1963-2021 数据来源:互联网公开数据 标签:信号处理,卡尔曼滤波器,离子开关,竞赛数据,数据清理 数据概述: 本数据集源自利物浦大学的离子开关竞赛,由Chris Deotte的数据集经过TJ...
    packageimg
  • 多重线性回归数据集

    2025年4月20日   

    多重线性回归数据集 数据来源:互联网公开数据 标签:多重线性回归,机器学习,数据科学,特征工程,目标变量,数据建模,算法训练,预测分析,回归分析 数据概述:...
    packageimg
  • 假新闻识别训练数据集-初学者使用2023

    2025年4月20日   

    假新闻识别训练数据集-初学者使用2023 数据来源:互联网公开数据 标签:假新闻,真实新闻,机器学习,神经网络,文本分析,数据集,初学者,新闻鉴别 数据概述:...
    packageimg
  • Yelp酒店评论分类数据集

    2025年4月20日   

    Yelp酒店评论分类数据集 数据来源:互联网公开数据 标签:酒店,评论,分类,Yelp,文本分析,垃圾评论识别,自然语言处理 数据概述:...
    packageimg
  • 多模态单细胞整合数据集

    2025年4月20日   

    多模态单细胞整合数据集 数据来源:互联网公开数据 标签:单细胞分析,多模态数据,交叉验证,超参数优化,过拟合控制,数据集索引,机器学习 数据概述:...
    packageimg
  • 印度新闻摘要清理数据集1963-2021

    2025年4月20日   

    印度新闻摘要清理数据集1963-2021 数据来源:互联网公开数据 标签:新闻摘要,印度,数据清理,文本处理,自然语言处理,机器学习 数据概述: 本数据集是Kondalarao...
    packageimg
  • Jigsaw评论社区毒性评级数据集

    2025年4月20日   

    Jigsaw评论社区毒性评级数据集 数据来源:互联网公开数据 标签:评论,毒性,NLP,文本分析,自然语言处理,情感分析,社交媒体,评论内容,Jigsaw,Kaggle 数据概述: 本数据集包含用于Jigsaw 毒性评论评级比赛(2021)的定制数据。数据集来源于Jigsaw...
    packageimg
  • 欺诈检测预处理数据集

    2025年4月20日   

    欺诈检测预处理数据集 数据来源:互联网公开数据 标签:欺诈检测,预处理数据,一热编码,标签编码,特征工程,金融安全,风险评估 数据概述: 本数据集基于 IEE-CIS 欺诈检测数据集进行清洗和预处理,旨在为欺诈检测模型提供高质量的数据支持。数据预处理包括特征工程和数据编码,其中对具有小于5个唯一值的类别特征采用了一热编码(One-Hot...
    packageimg
  • 信用卡欺诈交易检测数据集-欧洲信用卡交易-2013年9月

    2025年4月20日   

    信用卡欺诈交易检测数据集-欧洲信用卡交易-2013年9月 数据来源:互联网公开数据 标签:信用卡欺诈,交易检测,欺诈识别,机器学习,数据分析,时间序列,PCA,风险管理 数据概述: 本数据集包含2013年9月欧洲信用卡交易的详细信息,旨在用于信用卡欺诈检测研究。...
    packageimg
  • PSS3E23软件缺陷集成预测数据集

    2025年4月20日   

    PSS3E23软件缺陷集成预测数据集 数据来源:互联网公开数据 标签:软件缺陷,集成预测,二分类,模型集成,比赛数据,时间序列,数据科学 数据概述: 本数据集是在Kaggle...
    packageimg
  • 通信支付模拟数据集

    2025年4月20日   

    通信支付模拟数据集 数据来源:互联网公开数据 标签:模拟数据,通信支付,交易行为,用户行为分析,随机生成,支付系统,数据模拟 数据概述:...
    packageimg
  • 汽车黑客CAN入侵检测数据集

    2025年4月20日   

    汽车黑客CAN入侵检测数据集 数据来源:互联网公开数据 标签:汽车黑客,CAN总线,入侵检测,网络安全,机器学习,自动驾驶,车联网 数据概述:...
    packageimg
  • RNA折叠挑战训练序列数据集

    2025年4月20日   

    RNA折叠挑战训练序列数据集 数据来源:互联网公开数据 标签:RNA折叠,挑战,训练序列,伪标签,模型预测,机器学习,生物信息学 数据概述:...
    packageimg
  • Deepfake视频人脸图像数据集第31部分-人脸识别与伪造检测-训练集

    2025年4月20日   

    Deepfake视频人脸图像数据集第31部分-人脸识别与伪造检测-训练集 数据来源:互联网公开数据 标签:Deepfake,人脸图像,视频帧,伪造检测,人脸识别,机器学习,计算机视觉,训练数据 数据概述:...
    packageimg
  • 数据2021年12月泰坦尼克生存预测五折交叉验证数据集

    2025年4月20日   

    数据2021年12月泰坦尼克生存预测五折交叉验证数据集 数据来源:互联网公开数据 标签:泰坦尼克号,生存预测,机器学习,交叉验证,数据分析,Kaggle,竞赛数据,特征工程 数据概述:...
    packageimg
  • KaggleUplift营销活动效果评估数据集-模型构建与转换2023

    2025年4月20日   

    KaggleUplift营销活动效果评估数据集-模型构建与转换2023 数据来源:互联网公开数据 标签:营销活动,效果评估,Uplift模型,机器学习,数据转换,Kaggle竞赛,用户行为,实验设计 数据概述: 本数据集包含了为Kaggle Uplift Shift...
    packageimg
  • 检测LLM生成文本数据集

    2025年4月20日   

    检测LLM生成文本数据集 数据来源:互联网公开数据 标签:LLM,生成文本检测,文本分类,自然语言处理,数据集合并,文本生成评估 数据概述: 本数据集是一个整合了多个数据集的综合集合,主要用于“LLM - Detect AI Generated...
    packageimg
  • 毒评分类挑战训练与测试数据集带标签

    2025年4月20日   

    毒评分类挑战训练与测试数据集带标签 数据来源:互联网公开数据 标签:毒评分类,机器学习,文本分析,自然语言处理 数据概述: 本数据集来源于毒评分类挑战,包含了合并的训练数据和带标签的测试数据。数据集中的每条评论都被标记为包含或不包含毒评,未标记的测试数据已从数据集中移除。该数据集旨在用于机器学习模型的训练和评估,特别是针对文本分类任务中的毒评检测。...
    packageimg