找到96个数据集

格式: ZIP 标签: 语言对比

过滤结果
  • 日琉方言_疑问文调查数据_2023_数据分卷

    2026年2月1日 30 110 1

    数据集概述 本数据集是日琉方言疑问文及疑问表现的调查工具与研究结果分卷,与同系列(1)共同构成完整数据集。内容包含方言疑问表现调查票、7个地区方言的调查结果(含部分音声数据)及相关研究论文,用于日琉方言疑问表现的描述与对照研究。 文件详解 文件名称:intr_20230323_2.zip 文件格式:ZIP...
    packageimg
  • FDM_Based_研究数据管理德语材料目录数据

    2026年2月1日 30 45 20

    数据集概述 本数据集为德语研究数据管理主题的材料目录,包含培训演示文稿、视频、模板等各类德语资源的目录信息,提供两种格式的文件版本,便于用户查阅和使用研究数据管理相关的德语学习与工作材料。 文件详解 文件名称:FDM-Materialkatalog-v1.ods 文件格式:ODS...
    packageimg
  • Hewramî_Based语言主语一致标记数据_已接收

    2026年1月30日 30 168 75

    数据集概述 本数据集是论文《Subject agreement emerges from topic continuity, not topic shift. Corpus-based evidence from...
    packageimg
  • xflr6_Source_人称合并词类型学评估补充材料数据

    2026年1月30日 30 60 54

    数据集概述 本数据集是论文《Assessing the typology of person portmanteaus》的补充材料,包含1个压缩文件,用于支撑人称合并词类型学的研究评估,为语言学领域相关分析提供辅助数据支持。 文件详解 文件名称:xflr6/portmanteaus-v1.0.zip 文件格式:ZIP...
    packageimg
  • Saami_Based_萨米语敏感动词派生表附录数据2022

    2026年1月29日 30 1 0

    数据集概述 本数据集是论文附录,包含4个文件,展示不同萨米语词典来源中记录的敏感动词派生词。数据以表格/列表形式呈现,给出动词派生的基础词(按对应语言/来源或北萨米语标注)及芬兰语简短释义。数据支持萨米语形态学研究,具体来源信息参见关联论文。 文件详解 文档文件(Document files) 文件名称:Liite4-4tav-...
    packageimg
  • Source_Concepts_Based非洲语言源概念研究数据

    2026年1月28日 30 196 60

    数据集概述 本数据集是论文“Mouths, tongues, and ears: Source concepts for 'language' across Africa”配套的Excel表格数据,包含非洲语言中“语言”相关源概念的研究数据,共1个文件,用于支撑非洲语言概念系统的分析研究。 文件详解...
    packageimg
  • AppendixA_Based_人称代词跨语言变异信息论研究数据

    2026年1月28日 30 64 60

    数据集概述 本数据集为论文附录A内容,包含来自语法资料的人称代词系统数据,用于支持人称代词跨语言变异的信息论研究,仅含一个文件。 文件详解 文件名称:appendixA.xlsx 文件格式:XLSX 字段映射介绍:文件为附录A的表格数据,具体字段未提供预览,推测包含与跨语言人称代词系统相关的语法资料内容。 数据来源 论文“They saw it,...
    packageimg
  • SDG8_Based_日语流行文化促进语言学习与经济赋能问卷数据

    2026年1月28日 30 20 6

    数据集概述 本数据集是为会议论文“Leveraging Japanese Pop Culture to Catalyze Language Learning and Economic Empowerment: A Pathway to Achieving SDG...
    packageimg
  • Enggano_Based_1895年词汇表CLDF标准化数据集

    2026年1月27日 30 135 50

    数据集概述 本数据集为1895年Enggano词汇表的数字化CLDF格式版本,匹配了Holle List的英文及印尼语释义,包含Enggano词汇的通用正字法、原始转录、音素分割及国际音标转写等信息,适用于濒危语言词汇研究与跨语言比较分析。 文件详解 文件名称:engganolang/holle-list-enggano-1895-2.0.0.zip...
    packageimg
  • Pama_Nyungan_Based_颜色词汇修订数据_语言学分析

    2026年1月27日 30 56 5

    数据集概述 本数据集为修订后的Pama-Nyungan语言颜色词汇表,包含约187种Pama-Nyungan语言的基础颜色术语。数据基于PNAS发表的Word表格修订,补充了Nash 2017年研究的修正内容,为语言学领域研究颜色术语演变提供结构化数据支持。 文件详解 文件名称:amended PNy colour vocabs...
    packageimg
  • nlp_text_sentence_Based_汉印尼复合句数据集

    2026年1月27日 30 199 150

    数据集概述 本数据集包含普通话与印尼语的复合句数据,核心内容围绕两种语言的复合句展开,为自然语言处理领域提供研究资源。数据集文件数量为1,无目录结构,主要文件格式为xlsx。 文件详解 文件名称:Data Set of Compound Sentences in Mandarin and Indonesian.xlsx 文件格式:XLSX...
    packageimg
  • 附录_42种语言定量定性分析结果_xlsx_多语言样本分析结果数据

    2026年1月27日 30 157 58

    数据集概述 本数据集展示基于42种语言样本的定量与定性分析结果,包含一份Excel文件,未划分训练/测试集、数据/标签集或原始/处理数据,无子目录结构,聚焦多语言分析领域的核心结果呈现。 文件详解 文件名称:Appendix2b_Results_of_quantitative_qualitative_analysis_42_languages.xlsx...
    packageimg
  • NewsSR_Based_塞尔维亚新冠疫情早期新闻语料库_多格式版

    2026年1月27日 30 132 69

    数据集概述 本数据集为塞尔维亚主要日报及新闻门户网站在新冠疫情早期(2020年3月至9月)发布的疫情相关新闻文章语料库,含纯文本版及带完整元数据的XML版,还配套有公民元语言评论语料库Covid-NEWS-Comm-SR,另有斯洛文尼亚和克罗地亚的平行版本。 文件详解 压缩文件1: 文件名称:SR xml.zip 文件格式:ZIP...
    packageimg
  • Compound_words_Based_阿拉伯语中文复合词样本数据

    2026年1月27日 30 27 10

    数据集概述 本数据集包含阿拉伯语与中文复合词相关的样本数据,聚焦两种语言复合词的对比研究场景,为语言学领域的复合词结构、构成规则等分析提供基础样本支持,数据集由单一文件构成。 文件详解 文件名称:Arabic & Chinese samples.xlsx 文件格式:XLSX...
    packageimg
  • CLDF_Derived_声音象征类型学语义与语音特征数据集2020

    2026年1月23日 30 199 174

    数据集概述 本数据集是基于Johansson等人2020年发表的《声音象征类型学》研究生成的CLDF格式数据集,核心内容为通过语义和语音特征定义宏观概念的声音象征类型学研究数据,包含一个压缩文件,便于语言类型学领域的研究与分析。 文件详解 压缩文件 文件名称:lexibank/johanssonsoundsymbolic-v1.3.zip...
    packageimg
  • JOST_专业翻译杂志_非二元性别出柜报道中性别公平语言策略的翻译研究数据

    2026年1月21日 30 107 89

    数据集概述 本数据集为论文“Translating Non-Binary Coming-Out Reports: Gender-Fair Language Strategies and Use in News...
    packageimg
  • Mondzish_Based_中国采集词汇录音转录数据库_2012_2015

    2026年1月20日 30 18 4

    数据集概述 本数据集为Mondzish(Mangish)词汇数据库,包含2012-2015年在中国采集的音频录音转录内容,是单一文件的词汇资源,可用于Mondzish语言的词汇研究与分析。 文件详解 文件名称:Mondzish_lexical_database.xlsx 文件格式:XLSX...
    packageimg
  • Areal_diachronic_Slavic_论元标记时空趋势研究修正数据集

    2026年1月20日 30 167 111

    数据集概述 本数据集是论文《Areal and diachronic trends in argument flagging across Slavic》的修正版数据库,由多所高校及研究机构合作构建,聚焦斯拉夫语系中论元标记的区域分布与历时演变趋势。数据集包含一个文件,为语言学研究提供结构化的分析基础。 文件详解...
    packageimg
  • NeoBiota_补充材料_入侵物种研究与生态保护文献语言对比分析数据_2019

    2026年1月19日 30 27 3

    数据集概述 本数据集是论文“Does invasive species research use more militaristic language than other ecology and conservation biology...
    packageimg
  • Assimilation_Directionality_希腊语与德语词典条目数据

    2026年1月19日 30 40 11

    数据集概述 本数据集包含带有[x]或[c]标记的希腊语与德语词典条目数据,聚焦于同化方向性主题。数据集仅含一个文件,无分层目录结构,未划分训练测试集、数据标签集或原始处理集,主要文件类型为.xlsx。 文件详解 文件名称:directionality of assimilation.data.xlsx 文件格式:XLSX...
    packageimg