找到2,381个数据集

标签: 数据清洗实践

过滤结果
  • 使用Seaborn的数据分析数据集

    2025年4月14日   

    使用Seaborn的数据分析数据集 数据来源:互联网公开数据 标签:数据分析,Seaborn,数据可视化,图表,热图,学习资源,数据探索 数据概述:...
    packageimg
  • 美国航空评论数据集

    2025年4月14日   

    美国航空评论数据集 数据来源:互联网公开数据 标签:美国航空,客户评论,数据清洗,数据分析,情感分析,客户流失分析,机器学习,Python 数据概述: 本数据集通过网络抓取自一家航空评论网站,包含超过3800条美国航空的客户评论。数据集仅有一列,即评论文本,其中包含可能需要清理的文本信息。这些评论数据为进行各种分析提供了丰富的材料。 数据用途概述:...
    packageimg
  • 奥利安星体育与户外数据集

    2025年4月14日   

    奥利安星体育与户外数据集 数据来源:互联网公开数据 标签:体育用品,户外用品,零售业,订单数据,客户数据,销售数据,数据清理,数据操作 数据概述:...
    packageimg
  • 电子产品月度销售数据集2019年

    2025年4月14日   

    电子产品月度销售数据集2019年 数据来源:互联网公开数据 标签:电子产品销售,月度销售数据,2019年,销售趋势分析,数据科学任务,Pandas应用 数据概述:...
    packageimg
  • 猎鹰9号火箭2010年至今发射任务数据集

    2025年4月14日   

    猎鹰9号火箭2010年至今发射任务数据集 数据来源:互联网公开数据 标签:猎鹰9号,火箭发射,SpaceX,太空探索,发射任务,时间序列,维基百科,Web Scraping,数据清洗 数据概述: 本数据集包含了自2010年至今SpaceX公司猎鹰9号火箭的发射任务相关数据。数据来源于维基百科,通过Web...
    packageimg
  • 智慧楼宇管理系统传感器名称元数据集

    2025年4月14日   

    智慧楼宇管理系统传感器名称元数据集 数据来源:互联网公开数据 标签:智慧楼宇,传感器名称,自动分割,无监督学习,神经语言模型,元数据 数据概述:...
    packageimg
  • 二手车价格预测数据集-车型-配置与价格-时间不限

    2025年4月14日   

    二手车价格预测数据集-车型-配置与价格-时间不限 数据来源:互联网公开数据 标签:二手车,价格预测,机器学习,汽车,车辆,价格,模型,数据分析,特征工程 数据概述: 本数据集包含了从网络上抓取的二手车信息,旨在用于二手车价格的预测分析。...
    packageimg
  • 新作文训练数据集

    2025年4月14日   

    新作文训练数据集 数据来源:互联网公开数据 标签:作文检测,人工智能,LLM竞赛,生成文本,非生成文本,文本长度,数据均衡 数据概述: 本数据集为作文检测AI...
    packageimg
  • 文本改写数据集PAWS

    2025年4月14日   

    文本改写数据集PAWS 数据来源:互联网公开数据 标签:文本改写,语义理解,句子对齐,自然语言处理,机器学习,模式识别 数据概述: 本数据集PAWS(Paraphrase Word...
    packageimg
  • LLM20问题解决方案关键词频率数据集

    2025年4月14日   

    LLM20问题解决方案关键词频率数据集 数据来源:互联网公开数据 标签:LLM,20问题解决方案,关键词频率,自然语言处理,机器学习,数据分析 数据概述: 本数据集包含用于解决LLM(大语言模型)20个问题的过滤后关键词列表及其出现频率。数据涵盖了与20个问题相关的常用关键词及其在解决方案中的使用频率,为研究和开发提供了宝贵的语言模型训练资源。...
    packageimg
  • 银行客户流失预测数据分析集

    2025年4月14日   

    银行客户流失预测数据分析集 数据来源:互联网公开数据 标签:客户流失,银行,预测模型,客户特征,数据清洗,特征工程,分类技术 数据概述:...
    packageimg
  • 斯里兰卡卢比外汇汇率数据集2010-2023

    2025年4月14日   

    斯里兰卡卢比外汇汇率数据集2010-2023 数据来源:互联网公开数据 标签:外汇汇率,斯里兰卡卢比,货币兑换,时间序列,经济分析,预测模型,市场动态 数据概述:...
    packageimg
  • 推特讽刺分类数据集

    2025年4月14日   

    推特讽刺分类数据集 数据来源:互联网公开数据 标签:讽刺识别,自然语言处理,NLP,社交媒体分析,文本分类,讽刺检测,推特数据 数据概述: 本数据集包含了大量推特帖子,并被分类为讽刺性内容,并进一步细分为不同的讽刺子类别。该数据集为自然语言处理领域的学习者提供了宝贵的资源,可用于训练和测试模型。 数据用途概述:...
    packageimg
  • 足球表现数据集

    2025年4月14日   

    足球表现数据集 数据来源:互联网公开数据 标签:足球,运动员表现,睡眠质量,肌肉酸痛,压力,运动科学,数据清洗,训练日常 数据概述:...
    packageimg
  • 意大利2021年12月1日汽油价格地理空间数据集

    2025年4月14日   

    意大利2021年12月1日汽油价格地理空间数据集 数据来源:互联网公开数据 标签:汽油价格,意大利,地理空间分析,汽车燃料,油价趋势,数据清洗,交通基础设施 数据概述: 本数据集收录了2021年12月1日在意大利所有加油站的各类汽车燃料价格记录,包括汽油、柴油、甲烷、丙烷-...
    packageimg
  • 数据2020年足球转会数据集

    2025年4月14日   

    数据2020年足球转会数据集 数据来源:互联网公开数据 标签:足球转会,2020,足球俱乐部,球员转会,数据清理,数据可视化,体育分析 数据概述:...
    packageimg
  • 数据1000对孟加拉语到俄语翻译数据集

    2025年4月14日   

    数据1000对孟加拉语到俄语翻译数据集 数据来源:互联网公开数据 标签:孟加拉语,俄语,翻译,语言学研究,机器翻译,语料库,双语系统,自然语言处理 数据概述:...
    packageimg
  • 罗马乌尔都语仇恨言论检测数据集

    2025年4月14日   

    罗马乌尔都语仇恨言论检测数据集 数据来源:互联网公开数据 标签:罗马乌尔都语,仇恨言论,社交媒体评论,数据融合,文本分析,自然语言处理 数据概述: 本数据集是由三个数据集合并而成,分别是RomanUrduDataSet、HS-RU-20和roman-Urdu-abusive-comment-...
    packageimg
  • 交互式数据分析笔记本自然语言到代码生成数据集

    2025年4月14日   

    交互式数据分析笔记本自然语言到代码生成数据集 数据来源:互联网公开数据 标签:自然语言处理,代码生成,交互式笔记本,机器学习,数据科学 数据概述:...
    packageimg
  • 楼宇管理系统数据点标签示例数据集

    2025年4月14日   

    楼宇管理系统数据点标签示例数据集 数据来源:互联网公开数据 标签:楼宇管理,物联网,数据标签,标准转换,能源效率,研究工具,自动化标签 数据概述:...
    packageimg