多领域新闻短文本摘要数据集

数据集概述

本数据集包含多领域(旅行、体育、数码、汽车、政治、健康等)的新闻短文本,总字数不超过一万字,可用于短文本摘要研究,且支持扩展至更大数据集。

文件详解

  • 文件数量:共25个文件,均为TXT格式,占比百分之百
  • 文件示例:Dataset22.txt、Dataset24.txt、Dataset2.txt、Dataset10.txt、Dataset16.txt、Dataset13.txt、Dataset20.txt、Dataset1.txt等
  • 文件内容:TXT文件包含各领域新闻短文本,以Dataset22.txt为例,内容涉及班加罗尔周边周末度假目的地推荐

适用场景

  • 自然语言处理研究:可用于短文本摘要模型的训练与测试
  • 多领域文本分析:适用于旅行、体育、数码等领域的文本特征提取与主题分类研究
  • 数据扩展实验:可验证短文本摘要方法在不同规模数据集上的性能
  • 文本内容预览:可快速获取各领域新闻短文本的核心信息
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.14 MiB
最后更新 2025年11月26日
创建于 2025年11月26日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。