MaReTE_Based_古埃及象形文字词汇音译模型数据_2023

数据集概述

本数据集包含基于Ramses音译语料库和AES古埃及语句料库构建的古埃及象形文字词汇音译模型,用于实现象形文字到现代文字的音译转换。数据集提供训练好的模型文件、辅助文件及源码,支持古埃及文字数字化研究,共包含9个文件。

文件详解

  • 文档类文件
  • 文件名称:Readme.txt
  • 文件格式:TXT
  • 字段映射介绍:包含数据集的构建背景、来源说明及文件结构等基本信息
  • 存档类文件
  • 文件名称:AccessoryFiles.zip、Models.zip、Output.zip、jar.zip、src.zip
  • 文件格式:ZIP
  • 字段映射介绍:分别包含辅助文件、模型文件、输出文件、可执行jar包及源码文件
  • 数据类文件
  • 文件名称:RamsesTrainingSetModel.json、AES+RamsesTrainingSetModel.json、AESModel.json
  • 文件格式:JSON
  • 字段映射介绍:基于不同语料库训练的音译模型文件,包含模型结构及参数信息

数据来源

The Ramses Transliteration Corpus、AES - Ancient Egyptian Sentences语料库

适用场景

  • 古埃及文字数字化研究: 用于象形文字文本的自动化音译处理,辅助古埃及文献的数字化整理
  • 数字人文工具开发: 为古埃及文字研究平台提供音译功能模块支持
  • 语料库语言学分析: 基于模型输出结果分析古埃及词汇的语音特征及演变规律
  • 学术研究辅助: 为古埃及学领域的论文撰写和文献解读提供音译技术支持
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 56.62 MiB
最后更新 2026年1月27日
创建于 2026年1月27日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。