找到159个数据集

标签: 语言特征

过滤结果
  • IN01041_Sanskrit_古印度Mrgesavarman2年未注明出处诏书梵语XML数据

    2026年1月8日 30 25 5

    数据集概述 本数据集包含IN01041号古印度文献,即Mrgesavarman在其统治2年发布的未注明出处诏书的梵语文本XML文件,无元数据。数据为单一文件,可用于古印度历史、梵语铭文及古代诏书制度的研究。 文件详解 文件名称:IN01041.xml 文件格式:XML...
    packageimg
  • IN02010_Sanskrit_XML_玛纳德瓦Te_Bahal基座铭文梵语XML数据_草稿版

    2026年1月8日 30 190 137

    数据集概述 本数据集包含IN02010编号的玛纳德瓦Te-Bahal基座铭文梵语文本,以XML格式存储,为Epidoc标准的草稿版本,计划纳入Siddham档案。数据无元数据,聚焦铭文原文内容,是梵语铭文数字化研究的基础资料。 文件详解 文件名称:IN02010.xml 文件格式:XML...
    packageimg
  • Čengić_Projekt_Glagolska_valencija_古希腊文本动词配价标注数据集

    2026年1月7日 30 1 0

    数据集概述 本数据集包含古希腊选定文本中不同版本的动词配价标注示例,涵盖多个标注模型的完整与非完整版本,涉及XML格式标注文件及DOCX格式文本版本,可用于古希腊语言学及自然语言处理领域的动词配价研究。 文件详解 XML标注文件(共4个)...
    packageimg
  • Multi_CAST_Source_Northern_Kurdish多语言语音文本标注数据2311

    2026年1月7日 30 201 82

    数据集概述 本数据集为Multi-CAST多语言语音文本标注语料库的一部分,包含Northern Kurdish语言的语音文本标注数据。该语料库由班贝格大学发布,是多语言口语文本标注资源的重要组成,可用于相关语言研究与自然语言处理应用。 文件详解 文件名称:Multi-CAST/mcnkurd-v2311.zip 文件格式:ZIP...
    packageimg
  • Flemish_Archaeological_Texts_佛兰芒地区考古文献量化研究数据_2017

    2026年1月7日 30 60 1

    数据集概述 本数据集对1945-2017年比利时佛兰芒地区的荷兰语考古文献进行量化分析,涵盖专著、期刊文章、发掘报告等4500余份文献,共5100余万字。为避免版权问题,去除连词、冠词及4字母以下词汇,包含元数据、文本匹配结果、停用词表及处理后数据压缩包,支持研究复现。 文件详解 METADATA.xlsx 文件格式:XLSX...
    packageimg
  • IN01040_Sanskrit_Based_Mrgesavarman第7年授权文书梵语XML数据

    2026年1月6日 30 51 9

    数据集概述 本数据集包含IN01040号Hiṭnahebbāgilu地区Mṛgeśavarman第7年授权文书的梵语文本XML文件,无元数据。文件数量为1,未划分训练/测试集、数据/标签集或原始/处理集,主要用于梵语历史文献的数字化存储与分析。 文件详解 梵语授权文书文件 文件名称:IN01040.xml 文件格式:XML...
    packageimg
  • IN01030_Based_Mrgesavarman6年Hosanagara赠款梵语文书XML数据

    2026年1月6日 30 185 122

    数据集概述 本数据集为IN01030编号的Hosanagara赠款文书,记录了Mrgesavarman6年的相关内容,以梵语XML格式存储。数据集不含元数据,仅包含一个核心文件,结构简单,便于直接访问和使用。 文件详解 文件名称:IN01030.xml 文件格式:XML...
    packageimg
  • Multi_CAST_Based_多语言口语文本标注语料库_Mandarin_Version2311

    2026年1月4日 0 87 56

    数据集概述 本数据集为Multi-CAST多语言口语标注文本语料库的中文部分,由Maria Vollmer于2023年贡献,收录于Geoffrey Haig和Stefan Schnell主编的语料库版本2311中。数据以压缩包形式提供,是研究中文口语标注文本的基础语料资源。 文件详解 文件名称:Multi-...
    packageimg
  • Schriftbelege_Hunsrik_xraywe_Lindenfelser_书面证据分析数据

    2026年1月4日 30 71 28

    数据集概述 本数据集为论文“Hunsrik xraywe”的分析语料,包含Facebook群组“Hunsrik Xprooch – Plat Taytx”中一周(2021年7月)的350条帖子及评论,共2250个词元,为Hunsrik语言的书面证据分析提供结构化数据支持。 文件详解...
    packageimg
  • IN01053_Sanskrit_XML_Mrgesavarman_Halsi_Grant梵语铭文文件

    2026年1月3日 30 134 21

    数据集概述 本数据集包含IN01053号Mrgesavarman的Halsi Grant梵语铭文的XML文件,无元数据。数据集仅含一个文件,无目录层级,文件类型单一为XML格式,未划分训练/测试、数据/标签或原始/处理数据。 文件详解 文件名称:IN01053.xml 文件格式:XML 字段映射介绍:包含Mrgesavarman的Halsi...
    packageimg
  • Borger_Sumerisches_Handwörterbuch_Based苏美尔双语词典数据0_1版

    2026年1月1日 30 10 4

    数据集概述 本数据集为R. Borger所著《Sumerisches Handwörterbuch hauptsächlich aufgrund der Bilinguen》的0.1版本数据,基于苏美尔双语材料构建,核心是苏美尔语双语词典相关内容,包含1个JSON格式文件,无目录层级划分。 文件详解 文件名称:bilinguenGlossar.json...
    packageimg
  • IN02032_Siddham_Based_Daramsthali铭文Sanskrit_XML草稿版数据

    2025年12月31日 30 109 76

    数据集概述 本数据集包含IN02032 Daramsthali铭文的Sanskrit XML文件,为Epidoc格式草稿版,无元数据,计划纳入"Siddham"档案。数据集仅含一个XML文件,无目录结构,未划分训练/测试、数据/标签或原始/处理数据。 文件详解 文件名称:IN02032.xml 文件格式:XML...
    packageimg
  • Linguistics_Supplementary_Material_西北班图语性别系统分类研究补充材料

    2025年12月31日 30 60 48

    数据集概述 本数据集是发表于《语言学》期刊的论文《西北班图语性别系统分类》的补充材料,包含一份压缩文件,用于支持论文中关于西北班图语性别系统分类研究的详细内容展示。 文件详解 文件名称:Supplemental_Information.zip 文件格式:ZIP...
    packageimg
  • IN02004_Sanskrit_Base_of_Pillar_Inscription梵语铭文XML草稿数据

    2025年12月29日 30 106 42

    数据集概述 本数据集包含IN02004号Changu Narayana柱基铭文的梵语XML文件,为Epidoc格式草稿版,无元数据,计划纳入"Siddham"档案。数据记录该柱基铭文的梵语文本内容,是研究古代铭文文献的基础资料。 文件详解 文件名称:IN02004.xml 文件格式:XML...
    packageimg
  • IN01023_Sanskrit_Based_Ravivarman12年Kuntagani授权梵语XML数据

    2025年12月29日 30 94 9

    数据集概述 本数据集为IN01023编号的《Ravivarman的Kuntagani授权》梵语文本XML文件,对应纪年为12年。数据不含元数据,仅包含一份XML格式的梵语铭文内容,是研究古代梵语铭文、历史授权文书的基础数字化资源。 文件详解 文件名称:IN01023.xml 文件格式:XML...
    packageimg
  • 哥廷根印度语言电子文本注册库_罗摩衍那数据集

    2025年12月25日 30 33 12

    数据集概述 本数据集是哥廷根印度语言电子文本注册库(GRETIL)中关于《罗摩衍那》(Rāmāyaṇa)的电子文本集合,包含多个章节或版本的文本文件,为印度古典文学研究提供基础资料。 文件详解 该数据集由13个HTML格式文件组成,具体如下: -...
    packageimg
  • 艺术翻译语言层面分析数据集

    2025年12月21日 30 125 90

    数据集概述 本数据集围绕艺术翻译的语言层面展开分析,核心内容为相关研究文档,为探究艺术翻译中的语言特征、翻译策略等提供资料支持。 文件详解 文件名称:Bakhridinova Etibor Adakhamovnavna.pdf 文件格式:PDF 内容说明:该文档聚焦艺术翻译的语言层面分析,具体内容需查阅文档获取。 适用场景...
    packageimg
  • 人类中心主义谚语的普遍性与民族特殊性数据集

    2025年12月24日 30 195 116

    数据集概述 本数据集聚焦人类中心主义谚语的普遍性与民族特殊性,分析不同语言体系中谚语作为俗语形式的共性与特性,以单篇PDF文档呈现相关研究内容。 文件详解 文件名称: Burkhonova Mokhira Omonilla qizi.pdf 文件格式: PDF 内容说明:...
    packageimg
  • 多语言广告文本中的成语转换研究文档

    2025年12月23日 30 202 41

    数据集概述 本数据集包含一份PDF文档,主题为突厥语族语言广告文本中的成语转换研究,聚焦于广告语境下成语的使用与变形分析,为相关语言与广告学研究提供参考资料。 文件详解 文件名称: Abdisamatov Ahrorjon Jalolxon oʻgʻli..pdf 文件格式: PDF 文件内容:...
    packageimg
  • 达兰斯塔利铭文翻译数据集

    2025年12月23日 30 68 66

    数据集概述 该数据集包含IN02032达兰斯塔利铭文的翻译文件,以PDF和DOCX格式存储,为研究古代铭文内容提供文本资料。 文件详解 文件名称:IN02032 LVIII Dhaaramsthali Stele.pdf 文件格式:PDF 内容:达兰斯塔利铭文石碑的翻译文档 文件名称:IN02032 LVIII Dhaaramsthali...
    packageimg