BBC新闻摘要数据集

BBC新闻摘要数据集 数据来源:互联网公开数据 标签:BBC,新闻摘要,文本总结,自然语言处理,机器学习,数据清洗,数据集 数据概述: 本数据集旨在为进行文本摘要任务的研究者和开发人员提供训练模型所需的数据资源。数据集包含2,225行数据,每行包含两列:“Text”(文本)和“Summary”(摘要)。每行数据由一篇详细的新闻文章及其对应的简要摘要组成,为开发和优化摘要算法提供了丰富的资源。 数据用途概述: 该数据集适用于训练文本摘要模型,使其能够有效地压缩信息同时保留原文的核心内容。此外,研究人员可以利用此数据集评估和细化不同新闻类别下的摘要性能。未来更新将包括文本分类标签,以便为跨类别新闻内容的摘要模型开发提供更丰富的上下文。 举例: 数据集中的一行示例如下: Text: "The Indian government launched a new initiative to promote entrepreneurship across the country. The Startup India program has received widespread support from both the public and private sectors." Summary: "India launches Startup India initiative with support from public and private sectors." 此示例展示了如何使用原始新闻文章作为输入,并生成简洁的摘要作为输出。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 1.98 MiB
最后更新 2025年4月15日
创建于 2025年4月15日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。