数据集概述
本数据集为西班牙语劳动法关键文件的双语问答数据集,包含150个问题及其对应答案,答案形式为西班牙《工人法规》130个部分中的条款编号及相关摘录。数据集支持信息检索与问答任务,共包含3个文件。
文件详解
- Extracted Terminology of Spanish Worker Statute.txt
- 文件格式:TXT
- 字段映射介绍:包含西班牙《工人法规》的术语提取内容,如“derecho supletorio”“centro formativo”“modificación”等关键术语。
- Spanish Workers Statute Articles.rar
- 文件格式:RAR
- 字段映射介绍:压缩文件,推测包含西班牙《工人法规》的条款原文内容。
- Cuatrecasas-OEG-Spanish Workers Statute Eval Dataset.xlsx
- 文件格式:XLSX
- 字段映射介绍:包含150个问题及其对应答案,答案关联《工人法规》的条款编号及相关摘录信息。
适用场景
- 信息检索模型训练: 用于训练针对西班牙语法律文本的信息检索模型。
- 问答系统开发: 支持西班牙语劳动法领域的问答系统构建与优化。
- 法律文本处理研究: 分析法律文本的术语提取、条款关联等自然语言处理任务。
- 双语法律数据应用: 为跨语言法律信息检索与问答任务提供数据支持。