找到148个数据集

标签: 历史语言学

过滤结果
  • Oskolskaya_Stoynova_Based_俄语动词词干纳奈语借入体特征完整数据2024

    2026年1月8日 30 118 95

    数据集概述 本数据集记录了借入纳奈语的俄语动词词干按体特征的分布情况,是俄语动词在纳奈语中适应性策略研究的基础数据,源自2024年相关语言学研究,包含1个核心文件。 文件详解 文件名称:Oskolskaya&Stoynova_Nanai verbs-2024-2.xlsx 文件格式:XLSX...
    packageimg
  • IN01040_Sanskrit_Based_Mrgesavarman第7年授权文书梵语XML数据

    2026年1月6日 30 182 172

    数据集概述 本数据集包含IN01040号Hiṭnahebbāgilu地区Mṛgeśavarman第7年授权文书的梵语文本XML文件,无元数据。文件数量为1,未划分训练/测试集、数据/标签集或原始/处理集,主要用于梵语历史文献的数字化存储与分析。 文件详解 梵语授权文书文件 文件名称:IN01040.xml 文件格式:XML...
    packageimg
  • IN01004_Podagadh_Based_Skandavarman毗湿奴足迹梵语铭文XML数据

    2026年1月6日 30 9 4

    数据集概述 本数据集包含IN01004号梵语铭文XML文件,内容为Skandavarman时期毗湿奴足迹相关的Podagadh基金会铭文,无附加元数据。数据集仅含一个文件,用于梵语铭文的数字化保存与文本分析。 文件详解 文件名称:IN01004.xml 文件格式:XML...
    packageimg
  • HTR_2023_2024_年冬季学校_维也纳国家图书馆_ONB_3891_号中世纪拉丁语手稿转录数据

    2026年1月3日 30 103 21

    数据集概述 本数据集为2023/2024年维也纳HTR手写文本识别冬季学校产出的中世纪晚期拉丁语手稿底本数据,对应维也纳国家图书馆(ÖNB)Cod....
    packageimg
  • ChroniclingAmerica_Based_美国报纸孤立主义语言AI分析数据集1898_1900

    2026年1月3日 30 99 39

    数据集概述 本数据集包含基于Chronicling America数据集的AI驱动搜索分析结果,聚焦1898-1900年美国报纸中与外交事务相关的“isolation”/“isolated”词汇使用情况,共包含2个文件,无目录结构。 文件详解 数据文件 文件名称:Zenodo Isolation 1898-1900.xlsx 文件格式:XLSX...
    packageimg
  • Historical_Corpus_of_Dutch_Based荷兰语历史时期动词簇语序变异研究数据集

    2026年1月2日 30 186 20

    数据集概述 本数据集为荷兰语历史动词簇语序变异研究的核心数据,包含对早期至晚期近代荷兰语中动词簇语序变异的影响因素分析数据,涉及社会语言学变量(时间、地域、文本体裁)与结构变量(过去分词形态、助动词类型等),支持相关语言学研究。 文件详解 文件名称:data_volgordevariatie_BTFG.xlsx 文件格式:XLSX...
    packageimg
  • IN02024_Draft_Siddham存档Kisipidi_Kulanchetole石碑梵语XML数据

    2025年12月30日 30 53 16

    数据集概述 本数据集为IN02024 Kisipidi Kulanchetole石碑的梵语文本XML文件,采用EpiDoc格式草案版本,计划纳入“Siddham”存档。数据无元数据,包含1个XML文件,用于记录该梵语石碑的数字化文本内容。 文件详解 文件名称:IN02024.xml 文件格式:XML...
    packageimg
  • CLDF_Based_South_American_Languages_Borrowing研究数据集2023

    2025年12月28日 30 36 22

    数据集概述 本数据集是Miller和List在2023年发表的《South American Languages Borrowing》研究的配套CLDF数据集,包含1个压缩文件,用于支持对南美洲语言词汇借用现象的检测与分析研究,文件存储于单层目录结构中。 文件详解 压缩文件 文件名称:lexibank/sabor-v1.0.zip 文件格式:ZIP...
    packageimg
  • GENT900000165290_Entangled_Histories_卢森堡与希尼伯爵领地法规汇编数据1691

    2025年12月27日 30 203 106

    数据集概述 本数据集为1691年出版的《卢森堡公国及希尼伯国敕令、条例、声明与规章汇编》(Recueil d'édits...)的转录数据,由Ghent University所藏版本转录而来,属于“纠缠历史”(Entangled Histories)项目成果,主要记录该时期两地的法律与行政文件内容。 文件详解...
    packageimg
  • 瓦克纳格尔定律研究论文

    2025年12月26日 30 118 89

    数据集概述 本数据集为一篇研究瓦克纳格尔定律的论文,探讨不同语言中附着词排序的句法分析方法,比较扎利兹尼亚克与其他学者模型的差异,涉及古俄语、保加利亚语等语言的附着词簇分析,为句法理论研究提供参考。 文件详解 文件名称: Go to Wackernagel.pdf 文件格式: PDF (.pdf) 文件内容:...
    packageimg
  • NewsEye_READ_AS_19世纪芬兰报纸训练数据集

    2025年12月24日 30 160 57

    数据集概述 该数据集包含19世纪芬兰报纸页面的带注释文本数据,共200页训练集页面图像由芬兰国家图书馆(NLF)提供,数据按PAGE格式构建,通过Transkribus平台生成,附带相关指南文档,为报纸文本识别模型训练提供支持。 文件详解 文件名称: Article GT guidelines for...
    packageimg
  • 拉丁编年史_斯拉夫国王纪_人工与计算文本分析结果数据集

    2025年12月24日 30 146 38

    数据集概述 本数据集包含一份PDF文件,呈现了对拉丁编年史《斯拉夫国王纪》(Gesta regum Sclavorum)中特定词元的频率分析结果,对比了基于Milorad Medini著作《Kako je postao Ljetopis popa Dukljanina》(1942)的人工分析与计算文本分析的对应数据。 文件详解...
    packageimg
  • 俄罗斯维吾尔乌兹别克人名变化的语言和超语言因素分析

    2025年12月23日 30 37 6

    数据集概述 该数据集聚焦俄罗斯维吾尔乌兹别克人名的变化现象,从语言和超语言因素两个维度展开分析,通过单篇PDF文档呈现相关研究内容,为探究人名演变的内外驱动机制提供资料支持。 文件详解 文件名称:S. S. Ibragimova.pdf 文件格式:PDF...
    packageimg
  • 斯拉夫语言中激进代词脱落与第三人称特指性研究

    2025年12月23日 30 156 155

    数据集概述 本数据集为一篇语言学研究论文,聚焦斯拉夫语言中的代词脱落现象,提出基于“激进代词脱落”与“弱/非代词脱落”的新分类体系,探讨第一、二人称与第三人称代词脱落的差异及历史成因。 文件详解 文件名称:Aggressive_pro_drop_and_the_specificity.pdf 文件格式:PDF(.pdf)...
    packageimg
  • 藏缅语音和词汇CLDF数据集1991

    2025年12月23日 30 26 12

    数据集概述 该数据集是基于孙宏开1991年出版的《藏缅语音和词汇》构建的CLDF格式数据集,核心内容为藏缅语族语言的语音与词汇相关数据,为语言比较研究提供标准化数据支持。 文件详解 文件名称:lexibank/suntb-v4.1.zip 文件格式:ZIP压缩包(.zip)...
    packageimg
  • 比哈尔沙里夫石柱铭文一号数据集

    2025年12月23日 30 194 57

    数据集概述 本数据集包含编号为IN00047的比哈尔沙里夫石柱铭文相关文献,内容源自《早期笈多国王铭文》一书,由印度考古调查局于1981年出版,具体涉及该书第348至350页的内容。 文件详解 文件名称: IN00047 Bihar Sharif Pillar Inscription 1.pdf 文件格式: PDF (.pdf) 文件内容:...
    packageimg
  • 伊比利亚_罗曼语对意大利_罗曼语方言及撒丁语历史影响文献目录

    2025年12月22日 30 8 6

    数据集概述 该数据集是一份围绕伊比利亚-罗曼语对意大利-罗曼语方言(那不勒斯语、西西里语)及撒丁语历史影响主题的文献目录。内容涵盖背景介绍、基础现象提及、相关影响现象讨论及特定现象深度研究等,作者计划定期更新,欢迎建议补充。 文件详解 文件名称:...
    packageimg
  • 西波莱尼亚语数词形式问卷与语料库标记数据集2016_2017

    2025年12月22日 30 147 131

    数据集概述 本数据集包含西波莱尼亚语使用者关于数词短语的问卷回答草稿,以及语料库中的数词短语标记数据。问卷基于Shevelov(1963)研究设计,涵盖视觉刺激回答与直接诱发的阳性人类名词数词形式,还补充了自由文本中的低位数词短语实例。 文件详解 文件名称: Questionnaire_NUMERALS(2017).pdf 文件格式: PDF...
    packageimg
  • 伊戈尔远征记_平行语料库中的附着词研究文档

    2025年12月22日 30 70 63

    数据集概述 本数据集为一份文档,内容源于2018年12月21日纪念Andrej A. Zalizniak的主题报告,围绕俄罗斯历史语言学展开,重点探讨Zalizniak提出的附着词内部排序模板原则及不定式结构中主格的描述,并通过历史语料库验证其理论,含《伊戈尔远征记》平行语料库中附着词及附着词簇频率的初步调查。 文件详解 文件名称:...
    packageimg
  • Jackknifing_the_Black_Sheep论文附录_ASJP分类性能与南岛语系数据集

    2025年12月22日 30 92 28

    数据集概述 本数据集包含《Jackknifing the Black Sheep》论文的两个附录,聚焦ASJP分类性能与南岛语系语言研究,涵盖南岛语系语言树状图及1137种语言变体的分类与参数数据。 文件详解 文件名称:Appendix1_AustronesianTree.pdf 文件格式:PDF 内容:南岛语系语言的ASJP树状图,呈现语言谱系关系...
    packageimg