数据集

虚假招聘信息检测数据集FakeJobPostingsDetectionDataset-mohamedmustafashaban

数据来源：互联网公开数据

标签：招聘信息, 虚假信息, 文本分类, 欺诈检测, 自然语言处理, 机器学习, 行业分析, 数据标注

数据概述：该数据集包含来自招聘网站的真实和虚假招聘信息，用于识别和区分虚假招聘广告。主要特征如下：时间跨度：数据未明确标注时间，可视为一段时间内收集的招聘信息快照。地理范围：数据覆盖全球范围，招聘信息来源于不同国家和地区。数据维度：数据集包括多个字段，如“job_id”（职位ID）、“title”（职位标题）、“location”（工作地点）、“department”（部门）、“salary_range”（薪资范围）、“company_profile”（公司简介）、“description”（职位描述）、“requirements”（职位要求）、“benefits”（福利待遇）、“telecommuting”（是否远程办公）、“has_company_logo”（是否有公司logo）、“has_questions”（是否有问题）、“employment_type”（雇佣类型）、“required_experience”（所需经验）、“required_education”（所需教育程度）、“industry”（行业）、“function”（职能）和“fraudulent”（是否为虚假招聘信息，0代表真实，1代表虚假）。数据格式：CSV格式，文件名为fake_job_postings.csv，便于数据分析和建模。数据来源：数据来源于招聘网站，已进行结构化处理。该数据集适合用于虚假招聘信息检测、文本分类和欺诈行为识别等相关研究。

数据用途概述：该数据集具有广泛的应用潜力，特别适用于以下场景：研究与分析：适用于自然语言处理、机器学习、信息安全等领域的学术研究，例如虚假信息检测算法的开发与评估、文本特征分析、欺诈行为模式识别等。行业应用：为招聘网站、求职平台、人力资源服务公司提供数据支持，例如构建自动化的虚假招聘信息过滤系统、提升招聘信息的真实性和安全性。决策支持：支持企业和求职者识别虚假招聘信息，降低欺诈风险，保障求职者的合法权益。教育和培训：作为机器学习、数据挖掘、自然语言处理等课程的实训素材，帮助学生和研究人员理解和应用文本分类、欺诈检测等技术。此数据集特别适合用于探索招聘信息中的欺诈模式，帮助用户构建有效的虚假招聘信息检测模型，提升招聘平台的安全性。

数据与资源

versions_20250401091504.zipZIP
15.86 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	15.86 MiB
最后更新	2025年5月30日
创建于	2025年5月30日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

虚假招聘信息检测数据集FakeJobPostingsDetectionDataset-mohamedmustafashaban

数据与资源

附加信息

注册成功！