数据集

财务文本情感分析词典数据集FinancialTextSentimentAnalysisLexicon-rudrasing

数据来源：互联网公开数据

标签：财务分析, 文本情感分析, 词典, 金融词汇, 自然语言处理, 情感分类, 文本挖掘, 风险评估

数据概述：该数据集包含来自Loughran-McDonald的财务文本情感分析词典，记录了与财务领域相关的词汇及其情感倾向。主要特征如下：时间跨度：数据未明确标注时间，可视为静态词典。地理范围：数据主要针对全球金融市场。数据维度：包含“Word”（词汇）、“Sequence Number”（词汇序列号）、“Word Count”（词汇出现次数）、“Word Proportion”（词汇比例）、“Average Proportion”（平均比例）、“Std Dev”（标准差）、“Doc Count”（文档计数）、“Negative”（负面情感）、“Positive”（正面情感）、“Uncertainty”（不确定性）、“Litigious”（诉讼倾向）、“Constraining”（约束性）、“Superfluous”（多余的）、“Interesting”（有趣）、“Modal”（情态）、“Irr_Verb”（不规则动词）、“Harvard_IV”（哈佛四级词汇）、“Syllables”（音节数）、“Source”（来源）等字段。数据格式：CSV格式，文件名为LoughranMcDonald_MasterDictionary_2018.csv，便于数据分析和文本处理。该数据集适合用于财务文本情感分析、风险评估、投资策略制定以及自然语言处理等领域的研究和应用。

数据用途概述：该数据集具有广泛的应用潜力，特别适用于以下场景：研究与分析：适用于金融文本分析、情感分析、舆情分析等学术研究，例如分析公司财报、新闻报道中的情感倾向。行业应用：为金融机构、投资公司、咨询公司提供数据支持，尤其在风险管理、投资决策、市场情绪分析等方面。决策支持：支持金融领域的决策制定，帮助用户理解市场情绪、评估风险、优化投资组合。教育和培训：作为金融学、数据科学、自然语言处理等课程的辅助材料，帮助学生和研究人员深入理解财务文本分析。此数据集特别适合用于探索财务文本中情感与市场表现之间的关系，帮助用户构建量化交易策略、预测市场趋势、提升风险管理能力。

数据与资源

versions_20250410095005.zipZIP
1.87 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	1.87 MiB
最后更新	2025年4月29日
创建于	2025年4月29日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

财务文本情感分析词典数据集FinancialTextSentimentAnalysisLexicon-rudrasing

数据与资源

附加信息

注册成功！