EB_Geo_Annotated_Manual_Location_Annotated_Dataset_大英百科全书条目地理人工标定参考数据集

数据集概述

本数据集包含大英百科全书文章中人工标注的地理位置信息,每条记录涵盖文章在frances平台的URI链接、文章名称、文章描述及识别出的位置。数据集仅含一个JSON格式文件,未划分训练/测试集或原始/处理数据,可用于地理信息提取相关研究。

文件详解

  • 文件名称:eb_geo_samples_annotated.json
  • 文件格式:JSON
  • 字段映射介绍:每条记录包含以下字段:URI(frances平台文章资源链接)、article name(文章名称)、article description(文章描述)、identified locations(人工标注的地理位置)。

数据来源

Encyclopaedia Britannica Collection

适用场景

  • 地理信息提取模型训练与评估:用于验证人工标注地理位置的准确性,优化自动地理信息提取算法。
  • 百科全书内容地理分布分析:统计大英百科全书文章中地理位置的覆盖范围与分布特征。
  • 语义标注质量研究:对比人工标注与自动标注结果,分析地理信息标注的误差来源。
  • 数字人文地理研究:结合文章内容与标注位置,探究历史或文化主题的地理关联。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.11 MiB
最后更新 2025年12月26日
创建于 2025年12月26日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。