安然公司电子邮件数据集-垃圾邮件检测与分析-2000-2002

安然公司电子邮件数据集-垃圾邮件检测与分析-2000-2002

数据来源:互联网公开数据

标签:电子邮件,垃圾邮件,安然公司,文本分析,自然语言处理,信息检索,邮件安全,金融,商业丑闻

数据概述: 本数据集源自“安然电子邮件数据集”,包含了大约150位安然公司员工的电子邮件,总计约50万封邮件。这些数据最初由美国联邦能源监管委员会(FERC)在调查安然公司倒闭事件时公开。数据集涵盖了2000年至2002年间的电子邮件通信,为研究电子邮件通信模式、垃圾邮件检测、以及公司内部信息流动提供了丰富的素材。

数据用途概述: 该数据集广泛应用于垃圾邮件检测模型的训练与评估、自然语言处理(NLP)相关的文本分析、以及信息检索的研究。研究人员可以利用该数据集分析邮件内容、发件人、收件人、时间等信息,以识别垃圾邮件的特征,构建更有效的过滤系统。此外,该数据集也适用于研究公司内部的沟通模式、人际关系网络分析,以及商业丑闻相关的文本挖掘。

数据与资源

附加信息

字段
版本 1.0
最后更新 四月 14, 2025, 23:24 (UTC)
创建于 四月 14, 2025, 23:24 (UTC)