佛教梵语词汇语义标注数据集

数据集概述

本数据集围绕佛教梵语词汇“saṃjñā”(想)展开,包含未校对的语料库索引行、语义标注CSV文件及研究预印本PDF文档,为探究术语模型与佛教梵语词汇翻译提供数据支持。

文件详解

  • 文件名称: Lugli_Samjna_wordsOrTerms_Concordances.xml:XML格式文件,包含从Sketch Engine导出的“saṃjñā”语料库索引行,由Lugli版本1自动分词器处理,未校对,存在分词错误。
  • 文件名称: LigeiaLugli2017_SamjnaWordOrTerm_SemanticAnnotationsDataset.csv:CSV格式文件,包含Ligeia Lugli于2017年对“saṃjñā”索引行的语义标注数据,部分内容是对Roberto Garcia 2016年原始数据集的修订版。字段包括REF(引用标识)、TEXT.TYPE(文本类型)、TEXT(文本内容)、TRADITION(传统类别)、DOMAIN(领域)、SENSE(语义)、SENSE.1(补充语义)。
  • 文件名称: Lugli2019_WordsOrTerms.pdf:PDF格式文件,是研究的预出版版本。

适用场景

  • 佛教术语翻译研究:分析“saṃjñā”在不同文本中的语义差异及翻译策略
  • 梵语词汇语义标注:探索佛教梵语词汇的语义分类与标注方法
  • 术语模型应用:验证术语模型在宗教文本词汇分析中的适用性
  • 语料库语言学研究:利用未校对语料库索引行开展梵语分词技术优化研究
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 1.45 MiB
最后更新 2025年12月6日
创建于 2025年12月6日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。