AED_TEI_Based_埃及长文本词汇排名位置值数据

数据集概述

本数据集包含埃及文本中词汇的排名位置值,仅覆盖超过100个词汇的文本。排名位置值通过词汇频率衡量其在文本内的相关性,为埃及学文本分析提供结构化词汇重要性参考。数据集含2个文件,以AED-TEI数据为基础。

文件详解

  • 文件名称:readme.txt
  • 文件格式:TXT
  • 字段映射介绍:数据集说明文档,包含文件组成、数据来源及JSON文件结构的简要描述。
  • 文件名称:aes_ranking_points_format.json
  • 文件格式:JSON
  • 字段映射介绍:JSON格式数据集,键为埃及长文本的TEI文本ID(对应AED-TEI数据),值为该文本内词汇的排名位置值(基于词频的相关性指标)。

数据来源

Schweitzer, Simon D. (2019). simondschweitzer/aed-tei: AED-TEI Version 1.0 (v1.0) [Data set]. Zenodo. https://doi.org/10.5281/zenodo.3580939

适用场景

  • 埃及学文本词汇分析: 研究埃及长文本中词汇的相对重要性及主题聚焦方向。
  • 古埃及文本语义研究: 通过词汇排名位置值推断文本核心内容与关键概念。
  • 文本语料库构建: 为埃及文本语料库补充词汇相关性结构化标注数据。
  • 数字人文工具开发: 作为训练数据支撑埃及文本自动主题提取、关键词识别工具的研发。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 7.13 MiB
最后更新 2026年1月30日
创建于 2026年1月30日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。