-
芝加哥Cyclistic自行车共享服务骑行数据分析数据集2020年10月-2021年9月
芝加哥Cyclistic自行车共享服务骑行数据分析数据集2020年10月-2021年9月 数据来源:互联网公开数据 标签:自行车共享,骑行数据,芝加哥,用户行为,出行分析,时间序列,数据清洗,市场营销 数据概述: 本数据集包含了芝加哥Cyclistic自行车共享服务在2020年10月至2021年9月期间的骑行数据,是为Fidel La... -
-
自然语言处理数据集-缩略语与表情符号
自然语言处理数据集-缩略语与表情符号 数据来源:互联网公开数据 标签:自然语言处理,文本预处理,缩略语,标点符号,表情符号,情感分析,数据清洗,文本挖掘,NLP 数据概述: 本数据集为自然语言处理(NLP)和文本挖掘任务提供了丰富的资源支持,包含多个关键文件,用于文本预处理过程中的数据清洗和特征提取。数据集主要组成部分包括:... -
南非公司活动指标数据集
南非公司活动指标数据集 数据来源:互联网公开数据 标签:公司年度报告,活动指标,南非,PDF解析,数据提取,文本挖掘,数据清洗,数据标准化,自动化处理,可持续发展指标 数据概述:... -
-
-
-
股票价格训练数据集
股票价格训练数据集 数据来源:互联网公开数据 标签:股票价格,日内交易,技术指标,RSI,投资策略,市场分析,数据清洗 数据概述: 本数据集基于过去约7个月的股票分钟级价格数据,涵盖2600多个股票代码,涉及科技、公用事业和通信等行业。数据经过筛选,仅保留符合 bullish RSI divergence... -
-
特征选择比赛数据集
特征选择比赛数据集 数据来源:互联网公开数据 标签:特征选择,机器学习,分类模型,竞赛数据,高维数据,降维,数据理解,数据清洗 数据概述: 本数据集源于COMSYS... -
-
IMDB电影与电视剧数据集
IMDB电影与电视剧数据集 数据来源:互联网公开数据 标签:IMDB,电影,电视剧,评分,特征提取,机器学习项目,数据清洗 数据概述: 本数据集基于IMDB公开数据,包含从1990年至今上映的电影和电视剧信息,经过特征提取和数据清洗处理,形成以下四个数据文件: 1. names_ratings.csv:包含演员及评分信息。 2.... -
芝加哥Cyclistic自行车共享项目骑行数据分析数据集-2022年3月至2023年2月
芝加哥Cyclistic自行车共享项目骑行数据分析数据集-2022年3月至2023年2月 数据来源:互联网公开数据 标签:自行车共享,骑行数据,芝加哥,出行分析,用户行为,时间序列,数据清洗,Google,Capstone项目 数据概述:... -
提示重写三元组数据集
提示重写三元组数据集 数据来源:互联网公开数据 标签:提示重写, LLM训练, 自然语言处理, 数据清洗, 字段映射, 机器学习, 人工智能 数据概述: 本数据集为用于大型语言模型(LLM)提示恢复竞赛的三元组数据集。原始数据集包含四个字段:prompt、original_text、input 和... -
印度假新闻清理数据集2016-2021
印度假新闻清理数据集2016-2021 数据来源:互联网公开数据 标签:假新闻,清理数据,新闻分析,机器学习,文本分析,数据清洗,新闻真实性验证 数据概述:... -
-
Enron邮件数据集垃圾邮件与非垃圾邮件分类数据集
Enron邮件数据集垃圾邮件与非垃圾邮件分类数据集 数据来源:互联网公开数据 标签:邮件,Enron,垃圾邮件,非垃圾邮件,文本分类,自然语言处理,数据清洗,邮件分析 数据概述:... -
Bellabeat智能设备用户行为分析数据集
Bellabeat智能设备用户行为分析数据集 数据来源:互联网公开数据 标签:智能设备, 用户行为, 健康追踪, 活动分析, 数据清洗, 市场营销, 体重管理 数据概述:... -
巴西电商交易订单商品数据清洗与分析数据集-2016-2018
巴西电商交易订单商品数据清洗与分析数据集-2016-2018 数据来源:互联网公开数据 标签:电商,巴西,订单,商品,销售,用户行为,市场分析,数据清洗 数据概述:... -