找到6个数据集

标签: 古典语言

过滤结果
  • AGREE_Based_古希腊语义模型评估基准数据集

    2026年1月31日 0 76 70

    数据集概述 本数据集为AGREE基准,用于评估古希腊语义模型,包含两项专家任务的原始数据、最终基准数据集及问卷原始答案。数据基于专家对古希腊词汇语义相关性的判断构建,支持语义模型性能验证,总计包含5个文件。 文件详解 1_agree_task1.json(JSON格式)...
    packageimg
  • LAGOOS_FWF资助_Karl_Benedikt_Hase1825年希腊语秘密日记XML数据

    2026年1月8日 30 161 129

    数据集概述 本数据集是Karl Benedikt Hase1825年秘密日记在线版本的XML文件,Hase作为19世纪巴黎学者以古希腊语撰写日记。数据由LAGOOS项目团队协作整理,包含日记转录、实体标记等编辑内容,仅含一个XML文件,用于支持历史文献研究与数字化分析。 文件详解...
    packageimg
  • CIRCSE_Latin_Sentiment_Lexicons_Based拉丁语情感词典第二版发布数据

    2026年1月2日 30 5 3

    数据集概述 本数据集为CIRCSE/Latin_Sentiment_Lexicons的第二版发布资源,包含拉丁语形容词和名词的情感词典,新增融合黄金标准与白银标准的“Latin Affectus”数据集,且该数据集已关联至LiLa知识库,适用于拉丁语情感分析相关研究。 文件详解...
    packageimg
  • 哥廷根印度语言电子文本注册吠陀数据集

    2025年12月23日 30 72 15

    数据集概述 本数据集是哥廷根印度语言电子文本注册(GRETIL)中关于吠陀(VEDA)的电子文本集合,包含37个HTML格式文件,主要为吠陀相关文本内容,未划分训练测试集、数据标签或原始/处理数据,为印度语言及吠陀文本研究提供基础资料。 文件详解 该数据集包含37个HTML格式文件,具体说明如下: - 文件类型: 所有文件均为.htm格式,占比100%...
    packageimg
  • 哥廷根印度语言电子文本注册中心_奥义书数据集

    2025年12月11日 30 149 19

    数据集概述 该数据集是哥廷根印度语言电子文本注册中心(GRETIL)收录的奥义书(UPANIṢAD)相关电子文本集合,包含三十五个HTML格式文件,无目录层级结构,未划分训练测试、数据标签或原始处理数据。 文件详解 文件类型:均为HTML格式(.htm),共三十五个文件...
    packageimg
  • 梵语词汇文本数据集SanskritVocabularyTextDataset-vedanshchaudhary

    2025年5月1日 30 170 15

    梵语词汇文本数据集SanskritVocabularyTextDataset-vedanshchaudhary 数据来源:互联网公开数据 标签:梵语, 语言学, 文本分析, 词汇, 文化研究, 古典语言, 文本挖掘, 印度文化 数据概述: 该数据集包含来自互联网的梵语词汇,记录了梵语单词的文本数据。主要特征如下:...
    packageimg