比利时法语法律问答与法规检索数据集-thedevastator

比利时法语法律问答与法规检索数据集-thedevastator 数据来源:互联网公开数据 标签:法律,比利时,法规,问答,检索,自然语言处理,机器学习,法律科技 数据概述: 本数据集(BSARD)是一个专为法律研究设计的资源,主要面向比利时法语法律领域。数据集包含超过22,600条比利时法律法规条文,以及超过1,100个由公民提出的法律问题。经验丰富的法律专家对每个问题进行了标注,标明了与其相关的法律法规条文,旨在帮助用户快速高效地进行法律研究。数据集涵盖了广泛的法律类别,如政府法规、民法、刑法等,为用户提供了全面的法律信息。

数据用途概述: 该数据集适用于多种研究和应用场景,包括但不限于: 1. 法律法规检索:用于构建法律法规检索系统,提高检索效率和准确性。 2. 自然语言处理(NLP):用于训练和评估NLP模型,以理解和处理法律文本。 3. 机器学习:用于开发机器学习算法,自动识别与给定法律问题相关的法规条文。 4. 法律咨询机器人:用于构建AI聊天机器人,为用户提供关于比利时法律的即时解答。 5. 法律领域研究:支持对法律法规、法律问题和法律类别之间关系的深入研究。 6. 教育培训:可用于法律专业学生的学习和实践,帮助他们熟悉法律法规和案例分析。

数据集包含三个主要文件:

train.csv:包含已标注的法律问题及其对应的法规条文。 * question:比利时公民提出的法律问题(字符串)。 * category:法律问题的广义类别(字符串)。 * subcategory:法律问题的更具体子类别(字符串)。 * extra_description:关于法律问题的附加信息(字符串)。 test.csv:包含公民提出的法律问题,但未标注对应的法规条文。 * question:比利时公民提出的法律问题(字符串)。 * category:法律问题的广义类别(字符串)。 * subcategory:法律问题的更具体子类别(字符串)。 * extra_description:关于法律问题的附加信息(字符串)。 synthetic.csv:包含合成的法律问题及其对应的法规条文、类别、子类别和额外描述。 * question:比利时公民提出的法律问题(字符串)。 * category:法律问题的广义类别(字符串)。 * subcategory:法律问题的更具体子类别(字符串)。 * extra_description:关于法律问题的附加信息(字符串)。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 1.85 MiB
最后更新 2025年4月23日
创建于 2025年4月23日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。