伊朗法律数据集
数据来源:互联网公开数据
标签:伊朗法律,议会,立法活动,文本分析,自然语言处理,NLP,政策研究,数据分析
数据概述
本数据集收录了截至2024年4月29日伊朗议会(Majlis)通过的法律记录,数据来源于官方网站rc.majlis.ir。数据集包含每项法律的关键信息,包括法律标题、通过日期、批准机构、法律具体内容以及指向原始法律文件的参考链接。数据经过清洗和预处理,适合用于文本分析、自然语言处理(NLP)以及法律研究等场景。
数据字段定义
1. 标题(title):法律的标题,用于标识每项法律的名称。
2. 日期(date):法律通过的日期,已转换为标准的日期时间格式(datetime)。
3. 批准机构(reference):负责批准该法律的机构名称。
4. 内容(content):法律的详细内容,经过词干提取(stemming)处理,便于文本分析任务。
5. 链接(url):指向rc.majlis.ir网站上原始法律文件的URL。
数据清洗步骤
- 日期字段已统一转换为datetime格式。
- 标题和内容字段已进行必要的预处理(如去除多余字符),便于后续的文本分析任务。
数据用途概述
该数据集适用于多种应用场景,包括但不限于:
1. 文本分析与自然语言处理(NLP)任务:利用标题和内容字段进行文本分类、主题建模、情感分析或命名实体识别等任务。
2. 法律研究与比较法律分析:深入研究伊朗法律体系,对比不同时间段或不同领域的立法内容。
3. 立法活动趋势分析:通过日期字段分析立法活动的动态变化,识别立法高峰期或特定领域的立法趋势。
4. 机器学习项目:适用于文本分类、聚类或预测立法活动等机器学习任务。
数据使用指南
要开始使用此数据集,请下载law_cleaned.csv
文件,并将其加载到您偏好的数据分析工具中。例如,在Python中,可以使用Pandas库加载数据:
```python
import pandas as pd
加载数据集
df = pd.read_csv('law_cleaned.csv')
查看前几行数据
print(df.head())
```
数据收集过程
数据通过爬取rc.majlis.ir网站获得,该网站包含伊朗法律的全面档案。数据集涵盖了截至2024年4月29日的所有可用法律记录。
其他说明
如果您发现此数据集有用,建议在您的研究或工作中引用此数据。此外,您还可以访问相关的GitHub仓库,查看或贡献代码和文档。
如有任何问题或反馈,欢迎通过GitHub提交问题,或直接联系saman8dehestani@gmail.com。