数据集概述
该数据集记录了1987年至2022年意大利完整立法周期(第十至第十八立法周期)的立法流程,基于官方法律档案Normattiva的预备文件构建,通过大语言模型将非结构化文本转换为结构化事件日志,支持法律领域的流程挖掘分析,填补社会法律系统流程挖掘数据缺口。
文件详解
- ProLiFIC_metadata.csv:CSV格式,每条记录对应一个立法案例,字段包括case_id(唯一标识)、title(法律标题)、legislature(立法周期)、government(执政政府)、publishing_date(公布日期)、implementation_date(生效日期)、decree_conversion(是否为法令转换)、eu_ratification(是否为欧盟批准)、articles(条款数)、description(内容摘要)、full_text_url(全文链接)
- ProLiFIC_event_log.csv:CSV格式,每条记录对应一个立法事件,字段包括case_id(关联法律标识)、chamber(立法机构)、activity_it(意大利语立法动作)、activity_en(英语翻译动作)、time(活动日期)、committee(涉及委员会)、person(参与人员)、chunk(文本片段)
- ProLiFIC_EDA.ipynb:Jupyter Notebook格式,包含元数据与事件日志的加载合并、时间戳解析、描述性统计计算、案例时长分析及可视化代码
- ProLiFIC_error_cases.txt:TXT格式,记录因格式或结构问题被修正或排除的case_id列表
数据来源
Normattiva(意大利官方法律档案)
适用场景
- 法律流程挖掘研究:分析意大利立法流程的事件序列与时间模式
- 法律领域大语言模型应用:验证LLM在非结构化法律文本结构化转换中的效果
- 立法制度比较分析:对比不同立法周期或政府执政期间的立法效率差异
- 法律政策研究:探索欧盟法规对意大利国内立法的影响路径
- 流程管理跨领域应用:拓展流程挖掘方法在社会法律系统中的实践边界