找到43,877个数据集

标签: 机器学习

过滤结果
  • LLM科学考试数据集-多样化数据源整合-竞赛专用

    2025年4月15日   

    LLM科学考试数据集-多样化数据源整合-竞赛专用 数据来源:互联网公开数据 标签:LLM, 科学考试, 数据集, 机器学习, 自然语言处理, 文本生成, 考试, 训练数据, MMLU, ChatGPT, Wikipedia 数据概述: 本数据集是为 LLM (大型语言模型, Large Language Model) 科学考试竞赛准备的, 包含了 6...
    packageimg
  • 股票价格预测影响因素综合分析数据集

    2025年4月15日   

    股票价格预测影响因素综合分析数据集 数据来源:互联网公开数据 标签:股票价格,预测,金融市场,情绪分析,社交媒体,新闻,博客,论坛,时间序列,机器学习 数据概述:...
    packageimg
  • 谷歌应用商店评论情感分析数据集-情感分类-多类别-二分类

    2025年4月15日   

    谷歌应用商店评论情感分析数据集-情感分类-多类别-二分类 数据来源:互联网公开数据 标签:情感分析,文本挖掘,自然语言处理,机器学习,评论数据,谷歌应用商店,二分类,多分类 数据概述: 本数据集包含两个文件:gpreviews_2.csv 和...
    packageimg
  • Gustavosta自然语言处理研究提示数据集-2023

    2025年4月15日   

    Gustavosta自然语言处理研究提示数据集-2023 数据来源:互联网公开数据 标签:NLP,提示,自然语言处理,研究资源,Huggingface,机器学习,数据集 数据概述: 本数据集由Huggingface Hub提供,包含从Stable...
    packageimg
  • 钓鱼网站URL特征分析数据集

    2025年4月15日   

    钓鱼网站URL特征分析数据集 数据来源:互联网公开数据 标签:钓鱼网站,URL,网络安全,机器学习,特征工程,恶意软件,风险评估 数据概述:...
    packageimg
  • 大学AI客户违约预测数据集

    2025年4月15日   

    大学AI客户违约预测数据集 数据来源:互联网公开数据 标签:客户,违约预测,二分类,机器学习,数据集,入门教程 数据概述: 本数据集来源于一次黑客马拉松活动,是一份标注好的数据集,包含不同客户的信息及其是否会违约的数据记录。数据集适合初学者用于测试和提高二分类模型的构建和评估技能。 数据用途概述:...
    packageimg
  • 音乐流派分类预测数据集

    2025年4月15日   

    音乐流派分类预测数据集 数据来源:互联网公开数据 标签:音乐,流派,分类,机器学习,音频,文本,歌曲,预测 数据概述: 本数据集旨在为音乐流派分类任务提供数据支持。数据集包含了大量歌曲的音频特征和相应的流派标签。数据主要来自Kaggle,是一个用于训练和评估音乐流派分类模型的常用数据集。数据集的更新版本已在Kaggle上发布,提供了更准确和全面的数据。...
    packageimg
  • 金融风险评估数据集

    2025年4月15日   

    金融风险评估数据集 数据来源:互联网公开数据 标签:金融风险,信用评分,贷款审批,风险模型,金融分析,数据科学,机器学习 数据概述:...
    packageimg
  • 电子邮件垃圾邮件数据集

    2025年4月15日   

    电子邮件垃圾邮件数据集 数据来源:互联网公开数据 标签:电子邮件,垃圾邮件,过滤,机器学习,数据分析,网络安全,邮件分类 数据概述:...
    packageimg
  • 孟加拉国房价数据集

    2025年4月15日   

    孟加拉国房价数据集 数据来源:互联网公开数据 标签:孟加拉国,房价,房地产,市场分析,投资决策,房产估值,机器学习,价格预测,聚类分析,需求预测,异常检测 数据概述:...
    packageimg
  • 国际学习表征会议评审数据集2017

    2025年4月15日   

    国际学习表征会议评审数据集2017 数据来源:互联网公开数据 标签:国际会议,机器学习,学术评审,文本分析,决策过程,性别差异研究 数据概述:...
    packageimg
  • 总电子含量与太阳辐射数据集

    2025年4月15日   

    总电子含量与太阳辐射数据集 数据来源:互联网公开数据 标签:总电子含量,太阳辐射,UV辐射,EUV辐射,电离层,机器学习,预测模型,离子化,数据关联 数据概述:...
    packageimg
  • DQLab电信客户流失预测数据集-2020年6月

    2025年4月15日   

    DQLab电信客户流失预测数据集-2020年6月 数据来源:互联网公开数据 标签:电信,客户流失,预测,机器学习,数据清洗,探索性数据分析,预处理,建模 数据概述:...
    packageimg
  • SigmaCab出行服务价格预测数据集

    2025年4月15日   

    SigmaCab出行服务价格预测数据集 数据来源:互联网公开数据 标签:出租车,出行,预测,价格,机器学习,客户行为,数据分析 数据概述: 本数据集由Sigma Cab公司提供,旨在用于预测其出租车服务的动态价格调整(surge_pricing_type)。Sigma...
    packageimg
  • 房地产房价预测数据集

    2025年4月15日   

    房地产房价预测数据集 数据来源:互联网公开数据 标签:房地产,房价预测,数据预处理,特征工程,机器学习,监督学习 数据概述 本数据集包含经过全面预处理的房地产房价数据,适用于房价预测任务。数据集分为训练集(train)和测试集(test),涵盖了多个影响房价的关键特征。数据经过严格的清洗和处理,包括缺失值填充(null...
    packageimg
  • 随机性探索多领域异常数据集

    2025年4月15日   

    随机性探索多领域异常数据集 数据来源:互联网公开数据 标签:随机性,异常检测,统计分析,机器学习,数据科学,概率分布,数据生成 数据概述:...
    packageimg
  • TPS八月预测数据集

    2025年4月15日   

    TPS八月预测数据集 数据来源:互联网公开数据 标签:TPS,预测,数据集,时间序列,机器学习,数据分析,模型集成 数据概述: 本数据集包含作者针对TPS(Time Series Prediction)八月比赛的最终集成预测结果。数据集涵盖了预测模型在测试集上的输出,提供了详细的预测值,有助于评估模型在实际应用中的表现。 数据用途概述:...
    packageimg
  • 良性与钓鱼链接数据集

    2025年4月15日   

    良性与钓鱼链接数据集 数据来源:互联网公开数据 标签:良性链接,钓鱼链接,URL分类,机器学习,特征提取,网络安全 数据概述: 本数据集由研究人员提取,包含了用于训练机器学习模型分类URL为良性或恶意的特征数据。数据集中的URL被分为两类:良性链接和钓鱼链接,每类链接都具有相应的特征描述。 数据用途概述:...
    packageimg
  • 健康指标数据集

    2025年4月15日   

    健康指标数据集 数据来源:互联网公开数据 标签:健康指标,合成数据,Python faker,数据分析,机器学习,教育研究 数据概述: 本数据集包含1,000名个体的合成健康指标数据,使用Python...
    packageimg
  • 糖尿病诊断患者数据集1963-2021

    2025年4月15日   

    糖尿病诊断患者数据集1963-2021 数据来源:互联网公开数据 标签:糖尿病,患者数据,预测分析,机器学习,教育,人口统计,血糖水平,胰岛素水平,诊断结果 数据概述:...
    packageimg