找到28个数据集

标签: 句法分析

过滤结果
  • ALT_Based_亚洲语言树库项目缅甸语树库数据

    2026年1月31日 0 7 1

    数据集概述 本数据集是亚洲语言树库(ALT)项目下的缅甸语树库,包含约2万句从英文维基新闻翻译而来的缅甸语句子,由NICT和UCSY联合开发,遵循CC BY-NC-SA 4.0许可协议,为缅甸语自然语言处理研究提供结构化语料资源。 文件详解 压缩文件 文件名称:my-alt-190530.zip 文件格式:ZIP...
    packageimg
  • AnCora_西班牙语多层面标注语料库数据3_0_1

    2026年1月31日 30 82 29

    数据集概述 本数据集为AnCora 3.0.1西班牙语语料库,包含约50万字的新闻文本,覆盖词元、词性、句法成分、论元结构、动词语义类、名物化隐含论元等多层面标注,支持自然语言处理相关研究与应用。 文件详解 文件名称:AnCora 3.0.1 Spanish.zip 文件格式:ZIP...
    packageimg
  • ELTeC_hun_Based_匈牙利小说语料库数据2021_04

    2026年1月27日 30 107 53

    数据集概述 本数据集为ELTeC(欧洲文学文本集)项目下的匈牙利小说语料库2021年4月版本,包含100部编码为1级和2级的小说,总计2个文件,无目录层级结构。数据由欧洲文学历史远程阅读COST行动项目产出,支持欧洲文学的数字化研究。 文件详解 README.md 文件格式:MD...
    packageimg
  • ELTeC_ukr_Based_乌克兰小说语料库2021年4月发布数据

    2026年1月23日 30 56 23

    数据集概述 本数据集为ELTeC-ukr乌克兰小说语料库2021年4月发布版本,包含50部编码为1级的乌克兰小说。数据集共2个文件,无目录结构,主要文件类型为压缩包和说明文档,用于支持欧洲文学远程阅读研究。 文件详解 文件名称:README.md 文件格式:MD 字段映射介绍:包含语料库基本信息、贡献者列表、项目背景(COST Action...
    packageimg
  • Annexe_7_Corpus_Based_法国媒体文章与公民评论完整语料库数据

    2026年1月15日 30 52 9

    数据集概述 本数据集为Annexe 7法国媒体文章与公民评论完整语料库,包含法国媒体发布的文章及公民对其的评论内容,以压缩包形式提供,是用于自然语言处理研究的文本语料资源。 文件详解 文件名称:7. Annexe 7 Corpus version complète articles médias et commentaires citoyens...
    packageimg
  • Linguistics_Article_Based_汉语上位集体词解释与习得实验数据

    2026年1月14日 30 135 66

    数据集概述 本数据集为发表于《Linguistics》期刊的论文配套实验数据,核心内容是汉语上位集体词解释与习得的量化分析数据,包含实验相关的结构化信息,用于支撑论文中语法与语境因素对汉语上位集体词理解和习得影响的研究结论。 文件详解 文件名称:experimental_data_26july_2020_f.xlsx 文件格式:XLSX...
    packageimg
  • Spanish_text_corpus_Based_Wikipedia_自然语言处理语言学研究数据

    2026年1月7日 30 98 21

    数据集概述 本数据集是从Wikipedia提取的西班牙语文本语料库,适用于自然语言处理(NLP)和语言学研究。提取过程采用特定平台,相关方法在文献中有所记载。数据集包含原始提取结果和经清洗过滤后的句子数据,共2个文件。 文件详解 文件名称:rawdata.dat.zip 文件格式:ZIP(压缩包)...
    packageimg
  • 瓦克纳格尔定律研究论文

    2025年12月26日 30 41 3

    数据集概述 本数据集为一篇研究瓦克纳格尔定律的论文,探讨不同语言中附着词排序的句法分析方法,比较扎利兹尼亚克与其他学者模型的差异,涉及古俄语、保加利亚语等语言的附着词簇分析,为句法理论研究提供参考。 文件详解 文件名称: Go to Wackernagel.pdf 文件格式: PDF (.pdf) 文件内容:...
    packageimg
  • 沙夫卡特_拉赫蒙作品中句法单位构成隐喻的研究

    2025年12月23日 30 69 15

    数据集概述 本数据集围绕沙夫卡特·拉赫蒙作品中句法单位如何构成隐喻展开研究,包含一份相关的PDF文档,为探究该主题提供资料支持。 文件详解 文件名称: Дурдона Юнусова .pdf 文件格式: PDF(.pdf) 文件内容: 文档围绕“沙夫卡特·拉赫蒙作品中句法单位构成隐喻”这一主题展开,具体内容需通过PDF文件查看。 适用场景...
    packageimg
  • 俄语虚指成分to_eto与句子性论元分析文档

    2025年12月15日 30 15 3

    数据集概述 本数据集为一份PDF文档,聚焦俄语虚指成分to、eto的句法特征,重点分析与非一致名词谓语(带与格主语)及句子性论元(裸that从句或带to的that从句)相关的结构,探讨其语法功能与分布规律。 文件详解 文件名称: Expletive_elements_to_eto_SLS 2014.pdf 文件格式: PDF (.pdf) 内容说明:...
    packageimg
  • 欧洲文学文本语料库英文小说数据集2021

    2025年12月14日 30 149 33

    数据集概述 该数据集是欧洲文学文本语料库(ELTeC)的英文小说部分,2021年4月发布,包含100部英文小说的TEI XML源文件,由COST Action项目构建,为欧洲文学远程阅读研究提供支持。 文件详解 文件名称: README.md 文件格式: Markdown (.md) 内容:...
    packageimg
  • 提格利尼亚语语言建模数据集TLMD_v1_0_0

    2025年12月13日 30 120 66

    数据集概述 该数据集是为提格利尼亚语语言建模构建的单语种数据集,是同类数据中规模最大的提格利尼亚语数据集。数据经轻量清理,包含训练集(百分之九十八)和验证集(百分之二),支持自然语言处理研究。 文件详解 文件名称: tlmd_v1.0.0.zip 文件格式: ZIP压缩包 数据结构:...
    packageimg
  • 加泰罗尼亚政府网页爬取语料库2020

    2025年12月13日 30 151 83

    数据集概述 该数据集是2020年9月至10月从加泰罗尼亚政府.gencat域名及子域名爬取的加泰罗尼亚语网页语料库,含三千九百一十一万七千九百零九个词元、一百五十六万五千四百三十三个句子和七万一千零四十三篇文档,是加泰罗尼亚语文本语料库的子语料库。 文件详解 文件名称: catalan_government_crawling.zip 文件格式: ZIP...
    packageimg
  • 中世纪穆斯林非洲之角城市化与逆城市化进程补充材料_Handoga_吉布提_案例

    2025年12月12日 30 166 118

    数据集概述 本数据集为中世纪穆斯林非洲之角城市化与逆城市化进程研究的补充材料,聚焦Handoga(吉布提)与Fardowsa(索马里兰)的住宅结构句法分析数据,包含压缩文件、说明文档及分析计划图片,为相关历史地理研究提供数据支持。 文件详解 文档文件: Readme - Complementary...
    packageimg
  • 俄语提升诊断中的习语与分句句法研究

    2025年12月12日 30 47 25

    数据集概述 该数据集为一篇研究论文,聚焦现代俄语中提升与控制结构的区分,以习语片段为诊断工具,验证习语片段在提升谓词中保留、在控制谓词中不保留的预测,并探讨俄语习语内部句法及非句法适切条件对诊断的限制。 文件详解 数据集包含一个PDF格式的文档文件,具体如下: - 文件名称:...
    packageimg
  • 图皮语依存树库数据集

    2025年12月9日 30 54 31

    数据集概述 本数据集是图皮语依存树库(TuDeT),包含一个压缩文件,提供图皮语语言资源,用于自然语言处理(NLP)相关研究,为图皮语的句法分析提供数据支持。 文件详解 文件名称: tupian-language-resources/tudet-v0.4.zip 文件格式: ZIP(压缩文件) 内容说明:...
    packageimg
  • 俄语词序百科条目2014

    2025年12月7日 30 65 19

    数据集概述 本数据集为2014年发表于《大俄罗斯百科全书》第28卷的“Порядок слов(词序)”条目。内容涵盖俄语词序分析的基础框架,区分词序的限制性与非限制性方面,为俄语语法及词序研究提供权威参考。 文件详解 文件名称: WORD ORDER _ENCYCL 2014.pdf 文件格式: PDF (.pdf) 文件内容:...
    packageimg
  • 多成分复合句综合分析数据集

    2025年12月7日 30 106 39

    数据集概述 该数据集围绕多成分复合句展开综合分析,核心内容为一份PDF格式的研究文档,为语法结构、句子类型等语言研究方向提供基础资料。 文件详解 文件名称:Nazarova Sevarakhon Jakhongir kizi.pdf 文件格式:PDF 内容说明:包含关于多成分复合句的综合性分析内容,具体字段或章节需通过文档阅读获取 适用场景...
    packageimg
  • 语言句法子系统及其单位的通用语言学研究

    2025年12月5日 30 160 126

    数据集概述 本数据集为一份关于语言句法子系统及其单位的通用语言学研究文档,以PDF格式呈现,聚焦于从通用语言学视角对语言句法子系统及其构成单位的分析与探讨。 文件详解 文件名称: Khoshimov G.M..pdf 文件格式: PDF (.pdf) 文件内容: 该文档是关于语言句法子系统及其单位的通用语言学研究资料,具体内容需通过阅读PDF文档获取。...
    packageimg
  • 古俄语附着词空间研究及扎利兹尼亚克著作评述

    2025年12月5日 30 189 50

    数据集概述 本数据集为一篇评述性文献,围绕俄罗斯语言学家安德烈·扎利兹尼亚克2008年著作《古俄语附着词》展开,对比其1993年关于古俄语存在瓦克纳格尔定律的研究,探讨古俄语口语与书面语附着词系统的关系、多维分类方法及韵律与句法分析视角的差异。 文件详解 文件名称:2009-1_259-277.pdf 文件格式:PDF(.pdf)...
    packageimg