数据集

法律文书摘要生成与评估数据集LegalDocumentAbstractiveSummarizationandEvaluationDataset-veerchheda11

数据来源：互联网公开数据

标签：文本摘要, 法律文书, 自然语言处理, 摘要评估, Rouge指标, 文本生成, 司法案例, 机器翻译

数据概述：该数据集包含来自法律文书的摘要信息，记录了对司法案例进行摘要生成的文本数据及相应的评估指标。主要特征如下：时间跨度：数据未明确标注时间，可视为静态语料数据集。地理范围：数据来源于法律案例，未明确标注具体地理位置，但可推断为涉及不同司法辖区。数据维度：包括“Title”（案件标题）、“reference_summary”（参考摘要）、“tagged_summary”（带标签的摘要）、“tagged_rouge1”、“tagged_rouge2”、“tagged_rougeL”（带标签的Rouge指标）、“original_summary”（原文摘要）、“original_rouge1”、“original_rouge2”、“original_rougeL”（原文Rouge指标）、“tagless_summary”（无标签摘要）、“tagless_rouge1”、“tagless_rouge2”、“tagless_rougeL”（无标签Rouge指标）等多个字段，全面反映了摘要生成与评估的各个方面。数据格式：CSV格式，文件名为ILC_abstractive_3b.csv，便于数据分析和处理。数据已包含原始摘要、参考摘要、不同摘要生成方式的Rouge评估结果，以及相应的标签信息。该数据集适合用于文本摘要、机器翻译、自然语言生成等领域的研究，以及相关模型的训练和评估。

数据用途概述：该数据集具有广泛的应用潜力，特别适用于以下场景：研究与分析：适用于法律文本摘要、自动摘要生成、文本生成评估等方向的学术研究，例如，探索不同摘要生成算法的性能差异，以及评估摘要质量与Rouge指标之间的关系。行业应用：为法律科技公司、法律信息服务提供商提供数据支持，尤其在自动生成法律文书摘要、智能检索等方面具有应用价值。决策支持：支持法律专业人士快速获取案件核心信息，提高工作效率，辅助进行案件分析和决策。教育和培训：作为自然语言处理、法律文书分析等课程的辅助材料，帮助学生和研究人员深入理解文本摘要技术在法律领域的应用。此数据集特别适合用于探索法律文书摘要的生成方法，评估不同摘要生成算法的性能，以及研究如何提高摘要的质量和可读性，从而提升法律信息处理的效率和准确性。

数据与资源

法律文书摘要生成与评估数据集LegalDocumentAbstractiveSummariza...ZIP
1.87 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	1.87 MiB
最后更新	2025年5月11日
创建于	2025年5月11日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

法律文书摘要生成与评估数据集LegalDocumentAbstractiveSummarizationandEvaluationDataset-veerchheda11

数据与资源

附加信息

注册成功！