西班牙经济学家报经济新闻情感分析数据集-abrahammontoya
数据来源:互联网公开数据
标签:经济新闻,西班牙,情感分析,文本数据,新闻数据,网络爬取,自然语言处理,财经,新闻
数据概述:
本数据集包含了西班牙报纸《经济学家报》(El Economista)经济版块的新闻数据。 数据集涵盖了新闻的标题、作者、正文内容、发布日期和新闻URL。 所有新闻内容均为西班牙语。
此外,数据集还对每篇新闻进行了情感分析,标注了新闻的情感倾向(由GPT模型生成)。 同时,数据集中还包含了新闻的嵌入向量(Embeddings),便于进行更深层次的语义分析和相似度计算。
数据是通过网络爬虫技术获取的,爬虫代码可在以下GitHub链接中找到:https://github.com/Abraham1011/Data_science/tree/main
数据用途概述:
该数据集可用于多种研究和应用场景,包括:
* 情感分析研究:分析经济新闻的情感变化趋势,研究市场情绪与经济事件之间的关系。
* 新闻内容分析:进行文本挖掘,提取新闻中的关键信息,进行主题建模、关键词分析等。
* 语言模型训练:作为西班牙语新闻文本数据,可用于训练或微调语言模型。
* 信息检索系统:构建基于新闻内容的搜索引擎,提高信息检索的准确性和效率。
* 投资分析:结合新闻情感和市场数据,辅助投资决策。