印度短信垃圾信息检测数据集1963-2021

印度短信垃圾信息检测数据集1963-2021 数据来源:互联网公开数据 标签:短信,垃圾信息检测,文本分类,机器学习,自然语言处理 数据概述: 本数据集包含标注为“正常”(ham,合法短信)或“垃圾”(spam)的短信记录,旨在用于开发和评估垃圾短信检测的机器学习模型。数据集包括5574条记录,每条记录包含两个字段:“标签”(指示短信是正常还是垃圾信息)和“消息”(短信内容)。 数据用途概述: 该数据集可用于多种分析和建模目的,包括但不限于垃圾短信检测、文本预处理技术的实现与评估、特征提取技术的探索、自然语言处理技术的应用等。通过使用该数据集,可以增强短信过滤系统的性能,构建稳健的文本分类机器学习管道,研究垃圾短信和正常短信的语言学特性,并尝试各种自然语言处理和机器学习技术在文本数据上的应用。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 0.2 MiB
最后更新 2025年4月14日
创建于 2025年4月14日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。