-
MarkupMnA_并购协议标注数据集
2025年12月15日 30 183 108
数据集概述 该数据集包含151份美国上市公司并购协议的标注语料,基于SEC EDGAR数据库的HTML filings,添加了章节标题、章节号、页码等标注,采用BEIOS标签方案。旨在支持法律合同长文档的层级表示研究,可与MAUD数据集结合用于法律NLP研究。 文件详解 压缩包文件:...
-
MAUD_v1并购协议理解数据集
2025年12月14日 30 121 8
数据集概述 该数据集包含由经验律师监督标注的152份并购协议、47000余个标签,覆盖2021年美国律师协会公共目标交易点研究的92个问题,用于法律合同审查的自然语言处理研发。 文件详解 文件名称:MAUD v1 README.pdf 文件格式:PDF 内容说明:包含数据集的说明文档,提供数据集背景、使用方法等信息 文件名称:maud_v1.zip...
-
荷兰法律合同分析与翻译数据集
2025年4月15日 30 126 54
荷兰法律合同分析与翻译数据集 数据来源:互联网公开数据 标签:荷兰法律,合同分析,翻译,法律文本,文本分析,机器学习,法律研究 数据概述: 本数据集专为荷兰法律合同的分析和翻译而设计,适用于对荷兰法律文本进行深入研究。数据集包含了多种类型的荷兰法律合同文本,旨在为研究人员和开发者提供一个基础数据集,用于训练和优化如Gemma等法律文本分析与翻译工具。...



