找到1,036个数据集

标签: 语言学

过滤结果
  • Table_S1_粤语46方言点_iun_iut等韵尾反射词表数据

    2026年1月27日 30 9 6

    数据集概述 本数据集为粤语方言研究的词表数据,包含46个粤语方言点中-iun/iut、-un/ut韵尾的语音反射形式,同时附带-on/ot、-ion/iot、-in/it、-en/et韵尾的样本反射例词,用于展示粤语方言韵尾的演变规律。 文件详解 文件名称:revised_Table S1. Wordlist of 46 sites.xlsx...
    packageimg
  • Australian_Based_澳大利亚语言比较词表提示对齐数据

    2026年1月27日 30 52 43

    数据集概述 本数据集为澳大利亚语言的比较词表提示对齐版本,整合了Sutton & Walsh、Curr和Bates三份词表。数据可用于澳大利亚语言的比较分析、词源研究等语言学相关工作,包含一份文件。 文件详解 文件名称:S&W-Bates-Curr.xlsx 文件格式:XLSX 字段映射介绍:包含Sutton &...
    packageimg
  • TWKM_Based_古典玛雅文献数据库与词典_2014_2025

    2026年1月27日 30 199 161

    数据集概述 本数据集是“古典玛雅文献数据库与词典(TWKM)”项目的Zotero导出文献数据库,截至2025年3月。包含1746至2025年的4万余条书目条目,覆盖玛雅文化的碑铭学、考古学、语言学等多领域,是数字碑铭学和拉丁美洲文化遗产研究的核心参考资源,文件为JSON格式。 文件详解...
    packageimg
  • Lolo_Burmese_Based彝缅语比较词汇数据库_未完成版

    2026年1月27日 30 44 3

    数据集概述 本数据集为彝缅语比较词汇数据库,整合了Shintani(2001)和Lama(2012)的词汇表与释义内容,以电子表格形式呈现,目前仍处于开发中。数据集包含一份文件,用于支持彝缅语族语言的词汇比较研究。 文件详解 文件名称:Lolo-Burmese_lexical_database.xlsx 文件格式:XLSX...
    packageimg
  • BDPROTO_Source_古代与重构语言音系数据库_1_1版本

    2026年1月27日 30 3 0

    数据集概述 本数据集为BDPROTO 1.1版本,是古代与重构语言音系数据库,包含更多语言的音系清单及基础描述性统计,共2个归档文件,无目录结构,未区分训练/测试、数据/标签或原始/处理数据。 文件详解 归档文件 文件名称:bdproto-1.1.zip 文件格式:ZIP 内容说明:BDPROTO...
    packageimg
  • 生态系统服务术语分析数据_上海城市总体规划_补充材料2_2025年

    2026年1月27日 30 134 77

    数据集概述 本数据集是论文的补充材料2,聚焦上海市区总体规划中体现的生态系统服务概念与术语,包含一份分析文档,用于支撑相关研究的术语梳理与概念验证工作。 文件详解 文件名称:oo_1263487.docx 文件格式:DOCX...
    packageimg
  • srWac_Based_塞尔维亚_克罗地亚语重音标准动词发音数据库

    2026年1月27日 30 136 62

    数据集概述 本数据集为塞尔维亚语标准塞尔维亚-克罗地亚语中3000个最常用动词的重音标注数据库,收录了来自尼什、博尔和扎耶查尔的四位重音标准使用者对每个动词的限定式和非限定式发音及重音位置标注,旨在呈现该语言的重音标准情况。 文件详解 文件名称:Stress_standard_Serbian_3000verbs.xlsx 文件格式:XLSX...
    packageimg
  • IN02067_Based_Yengahiti碑文梵语XML草稿数据

    2026年1月27日 30 35 28

    数据集概述 本数据集包含编号为IN02067的Yengahiti地区Bhimarjuna与Visnugupta碑文的梵语文本XML文件,为Epidoc格式草稿版本,计划纳入"Siddham"档案。数据无元数据,仅包含一份XML文件,是研究古代梵语碑文的基础数字化资料。 文件详解 文件名称:IN02067.xml 文件格式:XML...
    packageimg
  • Grollemund_Bantu_班图语扩张栖息地影响人类迁徙研究数据2015

    2026年1月20日 30 187 98

    数据集概述 本数据集基于Grollemund等人2015年的研究,聚焦班图语扩张过程中栖息地对人类迁徙路线和速度的影响。数据以CLDF格式组织,包含相关语言演化与人类迁徙的关联信息,为研究人类扩散模式提供支持。 文件详解 压缩文件 文件名称:lexibank/grollemundbantu-v1.1.zip 文件格式:ZIP...
    packageimg
  • Plomley_Source_塔斯马尼亚语言研究原始数据_1976版

    2026年1月23日 30 151 22

    数据集概述 本数据集是对NJB Plomley 1976年整理发布的塔斯马尼亚语言相关资料的数字化处理结果,包含词汇数据、记录者信息、语言使用者信息等核心内容,经授权分发,为塔斯马尼亚语言研究提供结构化数据支持。 文件详解 Band names文件 文件名称:TAS-Bandnames.xlsx 文件格式:XLSX...
    packageimg
  • ANU_Based_澳大利亚语言词汇表方案整合数据_20181101

    2026年1月23日 30 157 99

    数据集概述 本数据集是澳大利亚语言各类“基础词汇表”的Excel汇编,整合了多位作者的研究成果,对英文注释及参考代码进行了对齐,并添加了来自ANU语言学网站的语义编码,为澳大利亚语言词汇研究提供结构化参考。 文件详解 文件名称:various_wordlist_schemes_20181101.xlsx 文件格式:XLSX...
    packageimg
  • Linguistics_土耳其乌兹别克语受事性与差异宾语标记分析数据

    2026年1月23日 30 94 20

    数据集概述 本数据集为发表于《Linguistics》期刊的论文《土耳其及乌兹别克语中的受事性与差异宾语标记》所使用的分析数据,包含支撑研究的CSV数据与R脚本文件,整体打包为一个压缩文件,供研究者复现或扩展相关语言学分析。 文件详解 文件名称:Kizilkaya_et_al.zip 文件格式:ZIP...
    packageimg
  • Regesta_Imperii_Based弗里德里希三世皇帝特许状登记册自动化翻译数据集

    2026年1月18日 30 56 9

    数据集概述 本数据集提供弗里德里希三世皇帝(1440-1493年在位)特许状登记册的英文自动化翻译内容,源自Regesta Imperii项目。翻译基于DeepL神经机器翻译技术,经专业术语词汇表补充及人工编辑,包含第1-36卷的简版登记册摘要,助力国际用户查阅中世纪皇权特许状文献。 文件详解 文件名称:Gesamt1.xlsx 文件格式:XLSX...
    packageimg
  • CLDF_Dataset_Kusunda语言250个概念词表数据2020

    2026年1月22日 30 115 68

    数据集概述 本数据集为CLDF格式,源自Aaley和Bodt于2020年发布的《New Kusunda data: A list of 250 concepts》,包含Kusunda语言的250个概念词表信息,是语言比较研究的标准化数据资源,仅含一个压缩文件。 文件详解 文件名称:lexibank/aaleykusunda-v2.1.zip...
    packageimg
  • Rigveda_VedaWeb_基于梨俱吠陀的形态标注语料库修订扩展数据

    2026年1月22日 30 190 1

    数据集概述 本数据集为梨俱吠陀的形态标注语料库,基于苏黎世大学原始标注数据修订扩展而成。包含梨俱吠陀文本的形态学、词汇学标注信息,涉及词形、格、性、数、人称、时态等语法特征,以及与格拉斯曼词典的关联参考,支持古印度语言的语言学研究。 文件详解 文件名称:vedaweb_zurich.xlsx 文件格式:XLSX...
    packageimg
  • Deepadung_Based_Palaung方言词汇比较数据集v1_3

    2026年1月22日 30 128 93

    数据集概述 本数据集源自Deepadung等人2015年发表的《中缅泰Palaung方言词汇比较》研究,以CLDF格式整理了Palaung方言的词汇对比数据,包含中国、缅甸、泰国三地Palaung方言的词汇信息,为语言多样性研究提供结构化资源。 文件详解 压缩包文件 文件名称:lexibank/deepadungpalaung-v1.3.zip...
    packageimg
  • La_Pola_Siero_Based_西班牙地图第5问口语语料文档数据

    2026年1月22日 30 163 78

    数据集概述 本数据集包含与“西班牙地图:第5问”相关的西班牙语口语语料文档,语料来源为La Pola Siero地区的口语内容,仅包含一个文档文件,无目录结构或数据划分,主要用于西班牙语口语语料相关的研究与分析。 文件详解 文件名称:Mapa de España.Pregunta5.docx 文件格式:DOCX...
    packageimg
  • La_Pola_Siero_Based_阿斯图里亚斯地图第五问口语语料数据

    2026年1月21日 30 122 72

    数据集概述 本数据集为关于阿斯图里亚斯地图第五问的口语语料数据,来自La Pola Siero地区的口语语料库。数据集包含1个文件,无目录结构,未划分训练/测试集、数据/标签集或原始/处理集,主要文件类型为DOCX格式。 文件详解 文件名称:Mapa de Asturias.Pregunta5.docx 文件格式:DOCX...
    packageimg
  • ResearchData_Eponyms_文献计量学人名命名术语研究数据集

    2026年1月21日 30 155 14

    数据集概述 本数据集是用于研究文献计量学文献中人名命名术语(eponyms)的起源、特征、主导性及概念网络的结构化数据。由Juan-Carlos Valderrama-Zurián及其合作者在相关研究中使用,为文献计量学领域的术语分析提供基础数据支撑。 文件详解 文件名称:23_ResearchData_Eponyms.xlsx 文件格式:XLSX...
    packageimg
  • La_Repubblica_Based_意大利共和报2011年文章摘录数据

    2026年1月21日 30 26 23

    数据集概述 本数据集包含意大利报纸《La Repubblica》2011年的文章摘录,对搜索关键词(dialett、Italian、lingu*)进行了高亮标注,仅用于科学研究。数据集文件总数为1,无目录结构,主要文件格式为DOCX。 文件详解 文件名称:Zenodo_Data.docx 文件格式:DOCX 字段映射介绍:包含意大利报纸《La...
    packageimg