纽约时报新闻小数据集

数据集概述

该数据集包含从纽约时报获取的10条新闻的前几段内容,收集于2023年Bertinoro语义网博士学校期间,由Dragon Team研究组用于项目工作。数据涉及大语言模型未包含的新信息,可用于知识图谱生成相关研究。

文件详解

  • 文件名称: isws_pw_wikipedia_dataset - Latest News from Ney York Times.pdf
  • 文件格式: PDF
  • 内容说明: 包含10条纽约时报新闻的前几段文本,无训练/测试、数据/标签或原始/处理数据的拆分结构

适用场景

  • 语义网研究: 可用于测试知识图谱生成过程中对新信息的推理能力
  • 自然语言处理实验: 适用于大语言模型处理未知信息的性能评估
  • 信息抽取研究: 可作为文本数据来源,探索从新闻文本中提取结构化知识的方法
  • 博士项目实践: 为语义网相关的学术项目提供实验数据支持
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.09 MiB
最后更新 2025年12月7日
创建于 2025年12月7日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。