新闻数据与金融市场数据集融合

数据集概述

本数据集通过融合多源数据构建,包含从网络抓取的新闻文本原始数据,以及提取新闻事件情感并与金融数据集合并的处理后数据,支持新闻与金融市场的联合研究,共一百一十五个CSV格式文件。

文件详解

该数据集由多个目录和文件组成,具体说明如下: - 原始数据文件(按来源分类): - 1-BBC News Raw Data目录:包含以日期命名的BBC新闻原始数据CSV文件,如3 nov bbc_data.csv、26 jan 24 bbc_data.csv等,字段示例为Heading(标题)、Date(日期)、Author(作者)、Content(内容)、Link(链接) - 1-Yahoo Finance Raw Data目录:包含以日期命名的雅虎财经原始数据CSV文件,如1 jan 24 yahoo finance-VXzvjV-a0Gxpb.csv、12 feb 24 yahoo finance-y1HAct-jWyvKG.csv等 - 合并与处理后数据文件: - 2-Merged News data目录:包含news_articles.csv,为合并后的新闻数据文件 - 3-derived features of news data目录:包含news_sentiment_yahoofinance_BBC.csv,为提取新闻情感特征的文件 - 4-Hybrid data目录:包含hybrid data.csv,为新闻与金融数据融合的混合数据集文件

适用场景

  • 金融市场预测:分析新闻情感对金融市场波动的影响
  • 媒体财经关系研究:探究不同新闻源内容与金融指标的关联性
  • 文本情感分析应用:验证新闻情感提取模型在金融领域的有效性
  • 多源数据融合研究:探索跨领域数据整合的方法与价值
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 78.32 MiB
最后更新 2025年11月28日
创建于 2025年11月28日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。