-
通用大型语言模型预训练文本与元数据数据集-ThePileSmall-thedevastator
2025年6月1日 30 29 10
通用大型语言模型预训练文本与元数据数据集-ThePileSmall-thedevastator 数据来源:互联网公开数据 标签:文本数据,元数据,自然语言处理,预训练,机器学习,情感分析,文本摘要,数据集,NLP 数据概述: 本数据集“The Pile... -
恶意与良性网址识别数据集-多源-网址-原始数据-pilarpieiro
2025年6月1日 30 11 5
恶意与良性网址识别数据集-多源-网址-原始数据-pilarpieiro 数据来源:互联网公开数据 标签:网址,URL,恶意,良性,安全,网络,数据,安全分析,网络安全,威胁情报 数据概述: 本数据集收集了来自多个来源的恶意和良性网址信息,旨在用于网址安全分析和恶意网址识别。... -
PII数据检测与生成数据集
2025年4月14日 30 29 1
PII数据检测与生成数据集 数据来源:互联网公开数据 标签:PII检测,数据生成,Gemini API,数据安全,机器学习,自然语言处理 数据概述: 本数据集通过Gemini... -
美国国家科学基金会NSF生物学奖项摘要数据集-picoplankton
2025年4月26日 30 27 4
美国国家科学基金会NSF生物学奖项摘要数据集-picoplankton 数据来源:互联网公开数据 标签:生物学,NSF,奖项,摘要,科研资助,学术研究,文本分析,自然语言处理 数据概述: 该数据集包含了来自美国国家科学基金会(NSF)的生物学领域奖项的摘要信息,记录了NSF资助的生物学研究项目的详细描述。主要特征如下: 时间跨度:... -
PIA客户评论数据集
2025年4月15日 30 14 9
PIA客户评论数据集 数据来源:互联网公开数据 标签:PIA,客户评论,航空服务,模型构建,预测分析,特征工程,探索性数据分析 数据概述: 本数据集来源于airlinequality.com网站,包含巴基斯坦国际航空(PIA)的客户评论记录。数据集涵盖了乘客对PIA服务的反馈和评价,为分析航空服务质量提供了第一手资料。 数据用途概述:... -
苹果叶片病害图像数据集健康-锈病-疮痂-混合数据集-piantic
2025年6月4日 30 29 5
苹果叶片病害图像数据集健康-锈病-疮痂-混合数据集-piantic 数据来源:互联网公开数据 标签:苹果,叶片病害,图像,健康,锈病,疮痂,植物病理学,数据集,机器学习,计算机视觉 数据概述:... -
全球天气数据训练数据集GWD清洗训练数据集-piantic
2025年4月23日 30 18 10
全球天气数据训练数据集GWD清洗训练数据集-piantic 数据来源:互联网公开数据 标签:全球天气,数据集,气象预报,机器学习,时间序列,环境科学,数据分析,预测模型 数据概述: 该数据集包含来自全球各地的天气数据,主要用于气象预报模型的训练。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。... -
呼吸系统生理状态预测数据集RespiratorySystemPhysiologicalStatePrediction-vladiluzjr
2025年5月16日 30 25 4
呼吸系统生理状态预测数据集RespiratorySystemPhysiologicalStatePrediction-vladiluzjr 数据来源:互联网公开数据 标签:医学, 生物工程, 呼吸, 压力预测, 机器学习, 时间序列分析, 仿真模拟, 数据建模 数据概述:... -
海洋水质理化性质数据集OceanWaterPhysicochemicalProperties-rosemaryjuarez
2025年5月1日 30 15 9
海洋水质理化性质数据集OceanWaterPhysicochemicalProperties-rosemaryjuarez 数据来源:互联网公开数据 标签:海洋学,水质监测,理化性质,环境科学,数据分析,地球科学,机器学习,环境监测 数据概述: 该数据集包含来自特定区域的海洋水质理化性质测量数据,记录了海洋环境中多种关键参数的数值。主要特征如下:... -
包含独立视频和独立图像的网页数据集-phueffer
2025年5月16日 30 11 4
包含独立视频和独立图像的网页数据集-phueffer 数据来源:互联网公开数据 标签:网页数据,视频,图像,视觉分析,数据集,网页结构,多媒体,信息检索 数据概述: 该数据集包含了带有独立视频(IVs)和独立图像(IGVs)的网页数据,旨在促进对网页视觉内容的研究。主要特征如下: 时间跨度: 数据记录的时间范围不限,反映了网页的当前状态。 地理范围:... -
Phoronix科技新闻文章标题与内容数据集
2025年4月15日 30 15 3
Phoronix科技新闻文章标题与内容数据集 数据来源:互联网公开数据 标签:科技新闻,NLP,文本分析,自然语言处理,新闻文章,Phoronix,文章标题,文本数据,数据挖掘 数据概述:... -
人工智能项目测试数据数据集-phoonyein
2025年4月24日 30 25 3
人工智能项目测试数据数据集-phoonyein 数据来源:互联网公开数据 标签:人工智能,数据集,测试数据,机器学习,模型评估,数据分析,项目实践,算法验证 数据概述: 该数据集包含用于人工智能项目的测试数据,旨在评估和验证各种机器学习模型的性能。主要特征如下: 时间跨度:数据记录的时间范围不明确,取决于具体的人工智能项目。... -
模型预测胜负结果数据集ModelPredictionWinnerResults-phongkhonghong
2025年4月29日 30 10 9
模型预测胜负结果数据集ModelPredictionWinnerResults-phongkhonghong 数据来源:互联网公开数据 标签:模型预测, 胜负结果, 机器学习, 预测分析, 数据建模, 结果评估, 竞赛预测, 数据集 数据概述: 该数据集包含多个模型预测胜负的结果,记录了不同模型对同一事件的胜负预测结果。主要特征如下:... -
推特平台NothingPhone手机用户发布推文数据集-时间跨度不限-sreelalh
2025年4月24日 30 24 8
推特平台NothingPhone手机用户发布推文数据集-时间跨度不限-sreelalh 数据来源:互联网公开数据 标签:社交媒体,推特,Nothing Phone,手机,用户行为,文本分析,情感分析,产品评论 数据概述: 本数据集包含了推特平台上用户发布的与“Nothing... -
苹果股票数据集自首部iPhone发布以来
2025年4月15日 30 12 5
苹果股票数据集自首部iPhone发布以来 数据来源:互联网公开数据 标签:苹果,股票,历史数据,金融分析,时间序列,投资趋势,科技公司 数据概述:... -
手机价格预测数据集MobilePhonePricePrediction-rameshgopi
2025年5月18日 30 24 7
手机价格预测数据集MobilePhonePricePrediction-rameshgopi 数据来源:互联网公开数据 标签:手机, 价格预测, 机器学习, 数据分析, 手机配置, 分类模型, 硬件参数, 数据集 数据概述: 该数据集包含来自手机市场的数据,记录了手机的各种硬件配置参数以及对应的价格区间信息,旨在用于手机价格的预测与分析。主要特征如下:... -
睡眠脑电图谱分析数据集-phmquangt
2025年5月29日 30 19 9
睡眠脑电图谱分析数据集-phmquangt 数据来源:互联网公开数据 标签:睡眠,脑电图,脑电图谱,睡眠分期,深度学习,医学,生理学,数据分析 数据概述:该数据集包含来自不同受试者的睡眠脑电图数据,用于睡眠阶段分析和睡眠质量评估。主要特征如下: 时间跨度:数据记录的时间范围通常为单次睡眠周期,即一个晚上。... -
恶意钓鱼网址数据集MaliciousPhishingURLDataset-tharaknad
2025年4月24日 30 23 8
恶意钓鱼网址数据集MaliciousPhishingURLDataset-tharaknad 数据来源:互联网公开数据 标签:网络安全,钓鱼,URL,数据集,机器学习,恶意软件,风险评估,安全研究 数据概述: 该数据集包含了大量恶意钓鱼网址的数据,旨在用于网络安全研究和实践。主要特征如下:... -
PHIO股票表现数据集
2025年4月15日 30 15 3
PHIO股票表现数据集 数据来源:互联网公开数据 标签:股票市场,历史数据,公司表现,投资分析,金融研究,市场趋势,时间序列 数据概述: 本数据集提供了特定公司股票市场的历史表现数据,记录了这些公司过去几年的股价变动情况。数据涵盖了多个时间点的股票价格,为分析股价趋势和波动提供了基础。 数据用途概述:... -
PHINC-平行印地英混合语社交媒体语料库用于机器翻译
2025年4月14日 30 22 9
PHINC-平行印地英混合语社交媒体语料库用于机器翻译 数据来源:互联网公开数据 标签:印地英混合语,机器翻译,社交媒体,代码混合,自然语言处理,多语言处理,语料库 数据概述:...