数据集

金融文本情感分析词典数据集FinancialTextSentimentAnalysisLexicon-payne18

数据来源：互联网公开数据

标签：金融, 文本分析, 情感分析, 词典, 语义分析, 自然语言处理, 财务报告, 数据挖掘

数据概述：该数据集包含来自Loughran-McDonald的金融文本情感分析词典，记录了大量单词及其在金融语境下的情感倾向。主要特征如下：时间跨度：数据未明确标注时间，可视为静态词典，用于通用金融文本情感分析。地理范围：该词典主要针对英语金融文本，可应用于全球范围内的金融分析。数据维度：数据集包括“Word”（单词）、“Sequence Number”（序列号）、“Word Count”（单词计数）、“Word Proportion”（单词比例）、“Average Proportion”（平均比例）、“Std Dev”（标准差）、“Doc Count”（文档计数）、“Negative”（负面情感）、“Positive”（正面情感）、“Uncertainty”（不确定性）、“Litigious”（诉讼倾向）、“Constraining”（约束性）、“Superfluous”（多余）、“Interesting”（有趣）、“Modal”（情态）、“Irr_Verb”（不规则动词）、“Harvard_IV”（哈佛IV词典）、“Syllables”（音节数）和“Source”（来源）等字段，涵盖了词汇的基本信息和情感属性。数据格式：CSV格式，文件名为LoughranMcDonald_MasterDictionary_2018.csv，方便数据处理和分析。该数据集提供了丰富的词汇情感标注，为金融文本的情感分析提供了基础。

数据用途概述：该数据集具有广泛的应用潜力，特别适用于以下场景：研究与分析：适用于金融领域的情感分析研究，如财务报告的情感分析、市场情绪分析、投资者情绪分析等。行业应用：可以为金融机构、投资公司、咨询公司等提供数据支持，用于风险评估、投资决策、舆情监测等方面。决策支持：支持金融领域决策的制定，例如通过分析新闻、社交媒体等文本数据，辅助投资组合管理和风险控制。教育和培训：作为金融分析、自然语言处理等课程的辅助材料，帮助学生和研究人员理解金融文本分析的原理和方法。此数据集特别适合用于探索金融文本中情感与市场行为之间的关系，帮助用户实现对金融市场更深入的理解和更有效的决策。

数据与资源

金融文本情感分析词典数据集FinancialTextSentimentAnalysisLexi...ZIP
1.43 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	1.43 MiB
最后更新	2025年5月17日
创建于	2025年5月17日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

金融文本情感分析词典数据集FinancialTextSentimentAnalysisLexicon-payne18

数据与资源

附加信息

注册成功！