洛杉矶市2020年以来犯罪数据分析数据集
数据来源:互联网公开数据
标签:洛杉矶犯罪,数据分析,犯罪趋势,安全研究,社会学,犯罪学,地理信息系统,数据可视化
数据概述:
本数据集涵盖了洛杉矶市2020年以来发生的犯罪事件记录,这些数据来源于原始的犯罪报告,因此可能存在一定的不准确性。数据集包含20多个变量,涵盖犯罪案件编号、日期、时间、地点、犯罪类型、嫌疑人行为模式、受害者信息、犯罪地点类型、使用武器情况、案件状态等多个方面,为犯罪趋势分析和社会安全研究提供了丰富数据基础。
数据用途概述:
该数据集适用于多种研究和分析场景,包括犯罪趋势分析、犯罪原因探究、犯罪与社会事件的相关性研究、未来犯罪预测、犯罪趋势可视化等。研究人员和政策制定者可以利用该数据集了解犯罪动态,评估犯罪预防和管理措施的有效性;教育机构可将其用于犯罪学、社会学、地理信息系统等课程的教学和研究。
数据集字段定义:
DR_NO:案件编号,由两位年份代码、区域ID和五位数字组成,数据类型为字符串
Date Rptd:犯罪报告日期,格式为MM/DD/YYYY,数据类型为日期时间
DATE OCC:犯罪发生日期,格式为MM/DD/YYYY,数据类型为日期时间
TIME OCC:犯罪发生时间,采用24小时制,数据类型为数值或字符串
AREA:洛杉矶市警局21个社区警察站编号,数据类型为数值或字符串
AREA NAME:21个社区警察站名称,数据类型为字符串
Rpt Dist No:报告区域编号,四位数代码,代表社区警察站内的子区域,数据类型为数值或字符串
Part 1-2:犯罪严重程度分类,Part 1为严重犯罪,Part 2为轻微犯罪,数据类型为数值
Crm Cd:犯罪代码1,数据类型为数值或字符串
Crm Cd Desc:犯罪代码描述,数据类型为字符串
Mocodes:嫌疑人行为模式代码,数据类型为数值或字符串
Vict Age:受害者年龄,数据类型为数值或字符串
Vict Sex:受害者性别,F表示女性,M表示男性,X表示未知,数据类型为字符串
Vict Descent:受害者族裔代码,数据类型为字符串
Premis Cd:犯罪地点类型代码,数据类型为数值
Premis Desc:犯罪地点类型描述,数据类型为字符串
Weapon Used Cd:犯罪中使用武器代码,数据类型为数值或字符串
Weapon Desc:犯罪中使用武器描述,数据类型为字符串
Status:案件状态,IC为默认状态,数据类型为字符串
Status Desc:案件状态描述,数据类型为字符串
Crm Cd 1:犯罪代码1,主要且最严重的犯罪代码,数据类型为数值或字符串
Crm Cd 2:次要犯罪代码2,数据类型为数值或字符串
Crm Cd 3:次要犯罪代码3,数据类型为数值或字符串
Crm Cd 4:次要犯罪代码4,数据类型为数值或字符串
LOCATION:犯罪地点所在街道,四舍五入到最近的百米区块,数据类型为字符串
Cross Street:犯罪地点交叉街道,数据类型为字符串
LAT:纬度,数据类型为数值
LON:经度,数据类型为数值
注意事项:
- 移除日期中的时间部分
- 将时间变量从数值转换为实际时间格式
- 创建包含纬度和经度的新列,便于数据可视化和位置标记
- 使用NA或特定字符串填充缺失描述
- 使用唯一值或留空填充缺失代码
推荐用途:
- 分析犯罪趋势和原因
- 探究犯罪与社会事件之间的关联
- 通过理解犯罪模式进行未来犯罪预测
- 制作犯罪趋势随年份、地点、性别或武器类型变化的可视化图表