Normalized_4000部中国地方志标准化章节标题数据

数据集概述

本数据集包含四千部中国地方志的标准化章节标题相关数据,涵盖地方志的元数据、矩阵数据及投影配置信息,可用于地方志文献的结构化分析与研究,总计包含三个文件。

文件详解

  • all_books_metadata.csv
  • 文件格式:CSV
  • 字段映射介绍:包含Book ID(地方志ID)、Book Name(地方志名称)、Admin Type(行政类型)、Level1(一级分类)、Level2(二级分类)、Address(地址)、Dynasty(朝代)、Period(时期)、Edition(版本)、Volume(卷数)、Author(作者)、Source Book(来源书籍)、Book Year(成书年份)、Edition Year(版本年份)、TimeSpan:begin(时间跨度起始)、TimeSpan:end(时间跨度结束)等地方志元数据字段。
  • matrix.csv
  • 文件格式:CSV
  • 字段映射介绍:包含以数字构成的矩阵数据,具体语义需结合上下文分析。
  • projector_config.json
  • 文件格式:JSON
  • 字段映射介绍:包含embeddings(嵌入)键的对象结构,用于配置投影相关参数。

适用场景

  • 地方志文献结构化研究:分析四千部地方志的标准化章节标题特征与规律。
  • 地方志元数据统计分析:基于all_books_metadata.csv中的朝代、时期、版本等字段,研究地方志的时空分布特征。
  • 文献数字化处理:为地方志的数字化整理与标准化处理提供数据支持。
  • 地方志内容挖掘:结合矩阵数据与投影配置,探索地方志章节标题的潜在关联与语义信息。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 94.43 MiB
最后更新 2026年1月29日
创建于 2026年1月29日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。