-
-
生成电子邮件垃圾邮件数据集
生成电子邮件垃圾邮件数据集 数据来源:互联网公开数据 标签:垃圾邮件,电子邮件,文本分类,机器学习,数据标注,合成数据,网络安全,文本数据,NLP,情感分析 数据概述: 本数据集包含一个CSV文件,该文件包含300条生成的电子邮件垃圾邮件消息。每个文件行代表一封单独的电子邮件,包括其标题和正文。该数据集旨在促进垃圾邮件电子邮件的分析和检测。... -
COVID-19死亡数据集
COVID-19死亡数据集 数据来源:互联网公开数据 标签:COVID-19,死亡数据,全球疫情,时间序列分析,公共卫生,数据分析,疫情趋势 数据概述:... -
数据1992-2014年欧美乐坛百大歌手综合数据集
数据1992-2014年欧美乐坛百大歌手综合数据集 数据来源:互联网公开数据 标签:音乐,歌手,欧美,排行榜,音乐数据,流行音乐,时间序列,文化娱乐 数据概述:... -
越南VN30指数及FLC指数股票价格数据集-2018年1月1日至2022年4月8日
越南VN30指数及FLC指数股票价格数据集-2018年1月1日至2022年4月8日 数据来源:互联网公开数据 标签:股票价格, VN30指数, FLC指数, 越南股市, 股票市场, 金融数据, 股市行情, 交易数据, 时间序列 数据概述:... -
花生叶片图像数据集1963-2021
花生叶片图像数据集1963-2021 数据来源:互联网公开数据 标签:花生,叶片图像,植物疾病检测,机器学习,图像识别,农业技术 数据概述: 本数据集包含用于识别和测量花生植物疾病严重程度的图像及其对应的标记XML文件。数据集是完整机器学习移动应用程序的一部分,旨在通过图像分析来检测并评估花生植物的疾病状况。 数据用途概述:... -
印度尼泊尔酒店评论数据集多语言版
印度尼泊尔酒店评论数据集多语言版 数据来源:互联网公开数据 标签:酒店评论,印度,尼泊尔,多语言,客户反馈,旅游分析 数据概述: 本数据集包含了印度和尼泊尔酒店的客户评论,评论内容分别以泰米尔语、尼泊尔语和英语呈现。数据集涵盖了大量不同语言的评论,为研究多语言客户反馈提供了丰富素材。 数据用途概述:... -
T-SeriesYouTube频道视频数据分析数据集-2024年4月
T-SeriesYouTube频道视频数据分析数据集-2024年4月 数据来源:互联网公开数据 标签:T-Series, YouTube, 视频, 印度, 音乐, 电影, 播放量, 订阅量, 数据分析, 视频统计 数据概述: 本数据集包含了T-Series YouTube... -
金融机构电话营销活动客户存款订阅预测数据集
金融机构电话营销活动客户存款订阅预测数据集 数据来源:互联网公开数据 标签:市场营销,客户行为,金融,电话营销,银行,存款,预测,分类,机器学习 数据概述:... -
亚马逊Prime视频流媒体影视作品数据集-美国地区2023年3月
亚马逊Prime视频流媒体影视作品数据集-美国地区2023年3月 数据来源:互联网公开数据 标签:亚马逊Prime,流媒体,影视作品,电影,电视剧,美国,JustWatch,娱乐,内容分析,电影数据库 数据概述: 本数据集旨在收录亚马逊Prime视频平台上的所有影视作品信息。数据来源于JustWatch,采集时间为2023年3月,涵盖美国地区的数据。... -
性别偏见西班牙语数据集
性别偏见西班牙语数据集 数据来源:互联网公开数据 标签:性别偏见,社交媒体分析,西班牙语,文本分类,数据标注,网络偏见,社会研究 数据概述: 本数据集包含超过1900条标注为有偏见或无偏见的西班牙语推文。这些数据是为减少互联网上性别偏见的黑客马拉松活动特别收集和标注的,旨在帮助识别和分析社交媒体中的性别偏见问题。 数据用途概述:... -
GUFICBIO-NS股票表现数据集
GUFICBIO-NS股票表现数据集 数据来源:互联网公开数据 标签:股票市场,历史数据,公司表现,投资分析,财务研究,市场趋势,时间序列分析 数据概述: 本数据集提供了特定公司的历史股票市场表现数据,涵盖了股票价格随时间的变化趋势及波动情况。这些数据为了解过去市场动态提供了详实的依据。 数据用途概述:... -
StackOverflow跨站点问题相似性研究数据集
StackOverflow跨站点问题相似性研究数据集 数据来源:互联网公开数据 标签:Stack Overflow,问答社区,问题相似性,跨站点,自然语言处理,文本挖掘,数据分析,软件开发 数据概述: 本数据集包含了Stack Overflow (SO) 以及 Stack Overflow 英文站点 (SOES) 的跨站点问题数据,主要用于研究不同... -
印度酒店预订数据集1962-2022
印度酒店预订数据集1962-2022 数据来源:互联网公开数据 标签:酒店,预订,印度,时间序列,客户分析,市场分析,客户行为 数据概述:... -
Spotify10000首歌曲音乐特征与流派分析数据集
Spotify10000首歌曲音乐特征与流派分析数据集 数据来源:互联网公开数据 标签:Spotify, 音乐, 歌曲, 流派, 数据分析, 音乐特征, 情感分析, 机器学习 数据概述: 本数据集包含了来自Spotify平台的10000首歌曲的详细信息,旨在用于音乐流派分析和情感分析研究。数据来源于公开的Spotify... -
Cyclistic自行车共享项目骑行数据分析数据集-2020-2022
Cyclistic自行车共享项目骑行数据分析数据集-2020-2022 数据来源:互联网公开数据 标签:自行车共享,骑行数据,用户行为分析,时间序列分析,会员制度,数据清洗,数据分析,芝加哥,Cyclistic 数据概述: 本数据集包含了Cyclistic自行车共享项目2020年至2022年期间的骑行数据,源自于“divvy-... -
小石城警察局派遣记录存档数据集
小石城警察局派遣记录存档数据集 数据来源:互联网公开数据 标签:小石城警察局,派遣记录,公共安全,犯罪数据,实时更新,时间序列,公共记录 数据概述:... -
-
Kaggle平台优秀Notebook评选与分析数据集
Kaggle平台优秀Notebook评选与分析数据集 数据来源:互联网公开数据 标签:Kaggle, Notebook, 数据科学, 机器学习, 代码, 社区, 排名, 竞赛, 分析 数据概述:... -
LLM科学验证数据集
LLM科学验证数据集 数据来源:互联网公开数据 标签:LLM验证,科学领域,问答数据,模型评估,交叉验证,对比实验 数据概述: 本数据集包含 500 个问答对(300 个由 @yalickj 创建,200 个来自比赛提供),主要用于评估大型语言模型(LLM)在科学领域的表现,特别是验证模型在交叉验证(CV)和...