-
LLM科学考试数据集-多样化数据源整合-竞赛专用
LLM科学考试数据集-多样化数据源整合-竞赛专用 数据来源:互联网公开数据 标签:LLM, 科学考试, 数据集, 机器学习, 自然语言处理, 文本生成, 考试, 训练数据, MMLU, ChatGPT, Wikipedia 数据概述: 本数据集是为 LLM (大型语言模型, Large Language Model) 科学考试竞赛准备的, 包含了 6... -
股票价格预测影响因素综合分析数据集
股票价格预测影响因素综合分析数据集 数据来源:互联网公开数据 标签:股票价格,预测,金融市场,情绪分析,社交媒体,新闻,博客,论坛,时间序列,机器学习 数据概述:... -
谷歌应用商店评论情感分析数据集-情感分类-多类别-二分类
谷歌应用商店评论情感分析数据集-情感分类-多类别-二分类 数据来源:互联网公开数据 标签:情感分析,文本挖掘,自然语言处理,机器学习,评论数据,谷歌应用商店,二分类,多分类 数据概述: 本数据集包含两个文件:gpreviews_2.csv 和... -
Gustavosta自然语言处理研究提示数据集-2023
Gustavosta自然语言处理研究提示数据集-2023 数据来源:互联网公开数据 标签:NLP,提示,自然语言处理,研究资源,Huggingface,机器学习,数据集 数据概述: 本数据集由Huggingface Hub提供,包含从Stable... -
-
大学AI客户违约预测数据集
大学AI客户违约预测数据集 数据来源:互联网公开数据 标签:客户,违约预测,二分类,机器学习,数据集,入门教程 数据概述: 本数据集来源于一次黑客马拉松活动,是一份标注好的数据集,包含不同客户的信息及其是否会违约的数据记录。数据集适合初学者用于测试和提高二分类模型的构建和评估技能。 数据用途概述:... -
音乐流派分类预测数据集
音乐流派分类预测数据集 数据来源:互联网公开数据 标签:音乐,流派,分类,机器学习,音频,文本,歌曲,预测 数据概述: 本数据集旨在为音乐流派分类任务提供数据支持。数据集包含了大量歌曲的音频特征和相应的流派标签。数据主要来自Kaggle,是一个用于训练和评估音乐流派分类模型的常用数据集。数据集的更新版本已在Kaggle上发布,提供了更准确和全面的数据。... -
-
-
孟加拉国房价数据集
孟加拉国房价数据集 数据来源:互联网公开数据 标签:孟加拉国,房价,房地产,市场分析,投资决策,房产估值,机器学习,价格预测,聚类分析,需求预测,异常检测 数据概述:... -
国际学习表征会议评审数据集2017
国际学习表征会议评审数据集2017 数据来源:互联网公开数据 标签:国际会议,机器学习,学术评审,文本分析,决策过程,性别差异研究 数据概述:... -
总电子含量与太阳辐射数据集
总电子含量与太阳辐射数据集 数据来源:互联网公开数据 标签:总电子含量,太阳辐射,UV辐射,EUV辐射,电离层,机器学习,预测模型,离子化,数据关联 数据概述:... -
DQLab电信客户流失预测数据集-2020年6月
DQLab电信客户流失预测数据集-2020年6月 数据来源:互联网公开数据 标签:电信,客户流失,预测,机器学习,数据清洗,探索性数据分析,预处理,建模 数据概述:... -
SigmaCab出行服务价格预测数据集
SigmaCab出行服务价格预测数据集 数据来源:互联网公开数据 标签:出租车,出行,预测,价格,机器学习,客户行为,数据分析 数据概述: 本数据集由Sigma Cab公司提供,旨在用于预测其出租车服务的动态价格调整(surge_pricing_type)。Sigma... -
房地产房价预测数据集
房地产房价预测数据集 数据来源:互联网公开数据 标签:房地产,房价预测,数据预处理,特征工程,机器学习,监督学习 数据概述 本数据集包含经过全面预处理的房地产房价数据,适用于房价预测任务。数据集分为训练集(train)和测试集(test),涵盖了多个影响房价的关键特征。数据经过严格的清洗和处理,包括缺失值填充(null... -
-
TPS八月预测数据集
TPS八月预测数据集 数据来源:互联网公开数据 标签:TPS,预测,数据集,时间序列,机器学习,数据分析,模型集成 数据概述: 本数据集包含作者针对TPS(Time Series Prediction)八月比赛的最终集成预测结果。数据集涵盖了预测模型在测试集上的输出,提供了详细的预测值,有助于评估模型在实际应用中的表现。 数据用途概述:... -
良性与钓鱼链接数据集
良性与钓鱼链接数据集 数据来源:互联网公开数据 标签:良性链接,钓鱼链接,URL分类,机器学习,特征提取,网络安全 数据概述: 本数据集由研究人员提取,包含了用于训练机器学习模型分类URL为良性或恶意的特征数据。数据集中的URL被分为两类:良性链接和钓鱼链接,每类链接都具有相应的特征描述。 数据用途概述:... -
健康指标数据集
健康指标数据集 数据来源:互联网公开数据 标签:健康指标,合成数据,Python faker,数据分析,机器学习,教育研究 数据概述: 本数据集包含1,000名个体的合成健康指标数据,使用Python... -
糖尿病诊断患者数据集1963-2021
糖尿病诊断患者数据集1963-2021 数据来源:互联网公开数据 标签:糖尿病,患者数据,预测分析,机器学习,教育,人口统计,血糖水平,胰岛素水平,诊断结果 数据概述:...