菲律宾短信数据集2022年9月29日至今

菲律宾短信数据集2022年9月29日至今 数据来源:互联网公开数据 标签:短信,垃圾短信,广告,政府公告,通知,验证码,时间戳,数据标注

数据概述: 该数据集包含了自2022年9月29日以来,作者个人接收的所有短信记录,每条短信都带有接收时间和阅读时间的时间戳,并被标注了相应的类别。数据集涵盖了各类短信,包括垃圾短信、广告、政府公告、通知和验证码,为研究短信分类和内容分析提供了详细的数据支持。

数据用途概述: 该数据集适用于短信分类研究、垃圾短信过滤、用户行为分析等多种场景。研究人员可以利用此数据改进垃圾短信检测算法;企业可以使用数据优化短信营销策略;政府机构可以借助数据提高公共信息发布的效率。此外,数据集也适合用于教育培训,帮助学习者了解短信分类的方法和技巧。

举例: 数据集包含以下字段定义: - date-received:短信接收的时间戳,时区为UTC+8。 - date-read:短信阅读的时间戳,时区为UTC+8。 - sender:部分隐藏的电话号码、未隐藏的字母数字发送者ID,或者以下三个特殊值之一:redacted_contact(发送者是个人联系人)、redacted_individual(发送者不是联系人且消息为请求性质,如配送员更新)、redacted_business(发送者为业务/服务且所有消息为请求性质)。 - category:短信类别,取值为spam(垃圾短信)、ads(广告)、gov(政府公告)、notifs(通知)或OTP(验证码)。 - text:短信的完整文本,适用于spam、ads和gov类别的短信。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 0.14 MiB
最后更新 2025年4月14日
创建于 2025年4月14日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。