数据集概述
本数据集包含古希腊选定文本中不同版本的动词配价标注示例,涵盖多个标注模型的完整与非完整版本,涉及XML格式标注文件及DOCX格式文本版本,可用于古希腊语言学及自然语言处理领域的动词配价研究。
文件详解
- XML标注文件(共4个)
- 文件名称:2023_Čengić_Projekt_1_Herod_2_77_4_Komplet_Model_1.xml、2023_Čengić_Projekt_1_Herod_2_77_4_Nepotpuno_Model_1.xml、2024_Čengić_Projekt_1_Herod_2_77_4_Model_2.xml、2024_Čengić_Projekt_1_Herod_2_77_Treći_model_Cad_Jov_Čeng.xml
- 文件格式:XML
- 字段映射介绍:包含古希腊文本的动词配价标注信息,对应不同标注模型(Model 1、Model 2、Treći model)的完整或非完整标注内容
- DOCX文本文件(共1个)
- 文件名称:2023_Čengić_Projekt_1_Herodot_2_77_4_Komplet_model_1_word verzija.docx
- 文件格式:DOCX
- 字段映射介绍:Model 1完整标注对应的文本版本文件
适用场景
- 古希腊语言学研究:分析古希腊文本中动词配价的标注规则与语言特征
- 自然语言处理模型训练:为古希腊语动词配价标注模型提供标注数据支撑
- 标注模型对比分析:比较不同标注模型(Model 1、Model 2等)在古希腊文本中的应用差异
- 语言学标注标准化研究:探索古希腊动词配价标注的标准化方法与格式规范