数据集 - 海数据

企业邮件垃圾分类样本数据集

2025年6月19日 30 90 60

数据来源：该数据集由美国能源公司 Enron 的内部通信记录构成，原始数据整理自 Enron Email Dataset，后经分类标注为“垃圾邮件”与“正常邮件”（Spam/Ham）两类，用于自然语言处理任务中的文本分类研究。字段定义： Message ID：邮件编号，唯一标识每封邮件 Subject：邮件主题 Message：邮件正文内容...
- zip
非结构化文本知识图谱构建数据集-humbleyll

2025年5月28日 30 90 15

非结构化文本知识图谱构建数据集-humbleyll 数据来源：互联网公开数据标签：知识图谱，非结构化文本，自然语言处理，文本挖掘，关系抽取，数据集，机器学习，数据分析数据概述：该数据集包含从各种非结构化文本中提取的信息，用于构建知识图谱。主要特征如下：时间跨度：数据记录的时间范围取决于原始文本的发布时间，通常涵盖多个时间段。地理范围：...
- ZIP

智能助手

您好！我是海数据平台的智能助手，有什么可以帮助您的吗？