-
企业邮件垃圾分类样本数据集
2025年6月19日 30 133 77
数据来源: 该数据集由美国能源公司 Enron 的内部通信记录构成,原始数据整理自 Enron Email Dataset,后经分类标注为“垃圾邮件”与“正常邮件”(Spam/Ham)两类,用于自然语言处理任务中的文本分类研究。 字段定义: Message ID:邮件编号,唯一标识每封邮件 Subject:邮件主题 Message:邮件正文内容... -
非结构化文本知识图谱构建数据集-humbleyll
2025年5月28日 30 65 13
非结构化文本知识图谱构建数据集-humbleyll 数据来源:互联网公开数据 标签:知识图谱,非结构化文本,自然语言处理,文本挖掘,关系抽取,数据集,机器学习,数据分析 数据概述: 该数据集包含从各种非结构化文本中提取的信息,用于构建知识图谱。主要特征如下: 时间跨度: 数据记录的时间范围取决于原始文本的发布时间,通常涵盖多个时间段。 地理范围:...