西班牙经济学家报经济新闻情感分析数据集-abrahammontoya

西班牙经济学家报经济新闻情感分析数据集-abrahammontoya 数据来源:互联网公开数据 标签:经济新闻,西班牙,情感分析,文本数据,新闻数据,网络爬取,自然语言处理,财经,新闻 数据概述: 本数据集包含了西班牙报纸《经济学家报》(El Economista)经济版块的新闻数据。 数据集涵盖了新闻的标题、作者、正文内容、发布日期和新闻URL。 所有新闻内容均为西班牙语。 此外,数据集还对每篇新闻进行了情感分析,标注了新闻的情感倾向(由GPT模型生成)。 同时,数据集中还包含了新闻的嵌入向量(Embeddings),便于进行更深层次的语义分析和相似度计算。 数据是通过网络爬虫技术获取的,爬虫代码可在以下GitHub链接中找到:https://github.com/Abraham1011/Data_science/tree/main 数据用途概述: 该数据集可用于多种研究和应用场景,包括: * 情感分析研究:分析经济新闻的情感变化趋势,研究市场情绪与经济事件之间的关系。 * 新闻内容分析:进行文本挖掘,提取新闻中的关键信息,进行主题建模、关键词分析等。 * 语言模型训练:作为西班牙语新闻文本数据,可用于训练或微调语言模型。 * 信息检索系统:构建基于新闻内容的搜索引擎,提高信息检索的准确性和效率。 * 投资分析:结合新闻情感和市场数据,辅助投资决策。

数据与资源

附加信息

字段
版本 1.0
最后更新 四月 23, 2025, 19:11 (UTC)
创建于 四月 23, 2025, 19:10 (UTC)