财务文本情感分析词典数据集FinancialTextSentimentAnalysisLexicon-rudrasing

财务文本情感分析词典数据集FinancialTextSentimentAnalysisLexicon-rudrasing

数据来源:互联网公开数据

标签:财务分析, 文本情感分析, 词典, 金融词汇, 自然语言处理, 情感分类, 文本挖掘, 风险评估

数据概述: 该数据集包含来自Loughran-McDonald的财务文本情感分析词典,记录了与财务领域相关的词汇及其情感倾向。主要特征如下: 时间跨度:数据未明确标注时间,可视为静态词典。 地理范围:数据主要针对全球金融市场。 数据维度:包含“Word”(词汇)、“Sequence Number”(词汇序列号)、“Word Count”(词汇出现次数)、“Word Proportion”(词汇比例)、“Average Proportion”(平均比例)、“Std Dev”(标准差)、“Doc Count”(文档计数)、“Negative”(负面情感)、“Positive”(正面情感)、“Uncertainty”(不确定性)、“Litigious”(诉讼倾向)、“Constraining”(约束性)、“Superfluous”(多余的)、“Interesting”(有趣)、“Modal”(情态)、“Irr_Verb”(不规则动词)、“Harvard_IV”(哈佛四级词汇)、“Syllables”(音节数)、“Source”(来源)等字段。 数据格式:CSV格式,文件名为LoughranMcDonald_MasterDictionary_2018.csv,便于数据分析和文本处理。 该数据集适合用于财务文本情感分析、风险评估、投资策略制定以及自然语言处理等领域的研究和应用。

数据用途概述: 该数据集具有广泛的应用潜力,特别适用于以下场景: 研究与分析:适用于金融文本分析、情感分析、舆情分析等学术研究,例如分析公司财报、新闻报道中的情感倾向。 行业应用:为金融机构、投资公司、咨询公司提供数据支持,尤其在风险管理、投资决策、市场情绪分析等方面。 决策支持:支持金融领域的决策制定,帮助用户理解市场情绪、评估风险、优化投资组合。 教育和培训:作为金融学、数据科学、自然语言处理等课程的辅助材料,帮助学生和研究人员深入理解财务文本分析。 此数据集特别适合用于探索财务文本中情感与市场表现之间的关系,帮助用户构建量化交易策略、预测市场趋势、提升风险管理能力。

数据与资源

附加信息

字段
版本 1.0
最后更新 四月 29, 2025, 23:05 (UTC)
创建于 四月 29, 2025, 23:05 (UTC)