众筹项目情感分析数据集CrowdfundingProjectSentimentAnalysisDataset-leahgoandsee
数据来源:互联网公开数据
标签:众筹项目, 情感分析, 文本分析, 项目分类, 机器学习, 自然语言处理, 数据标注, 市场调研
数据概述:
该数据集包含来自众筹平台的数据,记录了众筹项目的详细信息,并结合了情感分析结果。主要特征如下:
时间跨度:数据集未明确标注具体时间范围,但包含了项目的创建、发布和截止时间,可用于项目生命周期分析。
地理范围:数据集包含项目所在国家(country)和地区信息(location_state),覆盖范围广泛。
数据维度:数据集包含多个维度的数据,如项目ID (id)、项目描述 (blurb)、项目目标 (goal)、主要类别 (main_category)、子类别 (sub_category)、货币种类 (currency)、创建时间 (created_at)、截止时间 (deadline)、发布时间 (launched_at)、国家 (country)、地点 (location_state, location_type)、项目链接 (urls)、图片 (photo)、是否为员工推荐 (staff_pick)、是否禁用沟通 (disable_communication)、项目结果 (outcome)、情感指标 (sadness, joy, fear, disgust, anger, sentiment) 以及多种类别相关信息 (category, score, outcome)。
数据格式:CSV格式,文件名为hackathon_sample_set.csv,方便数据分析和机器学习建模。
来源信息:数据来源于众筹平台项目,已进行结构化处理,并整合了情感分析结果。
该数据集适合用于情感分析、项目分类、风险评估以及市场趋势分析。
数据用途概述:
该数据集具有广泛的应用潜力,特别适用于以下场景:
研究与分析:适用于情感分析、文本挖掘、项目成功预测等领域的学术研究,例如研究情感因素对项目成功的影响、项目类别对项目表现的影响等。
行业应用:为众筹平台、投资机构提供数据支持,可用于项目推荐、风险评估、市场分析、用户行为分析等。
决策支持:支持项目发起人优化项目描述、定价策略,提高项目成功率;支持投资者进行项目筛选,降低投资风险。
教育和培训:作为数据科学、机器学习、自然语言处理等课程的实训素材,帮助学生理解项目分析、情感分析在实际应用中的价值。
此数据集特别适合用于探索项目描述与情感因素、项目类别与成功率之间的关系,帮助用户实现项目优化、风险控制和市场预测等目标。