找到19个数据集

标签: 句法分析

过滤结果
  • 俄语虚指成分to_eto与句子性论元分析文档

    2025年12月15日 30 43 15

    数据集概述 本数据集为一份PDF文档,聚焦俄语虚指成分to、eto的句法特征,重点分析与非一致名词谓语(带与格主语)及句子性论元(裸that从句或带to的that从句)相关的结构,探讨其语法功能与分布规律。 文件详解 文件名称: Expletive_elements_to_eto_SLS 2014.pdf 文件格式: PDF (.pdf) 内容说明:...
    packageimg
  • 欧洲文学文本语料库英文小说数据集2021

    2025年12月14日 30 209 202

    数据集概述 该数据集是欧洲文学文本语料库(ELTeC)的英文小说部分,2021年4月发布,包含100部英文小说的TEI XML源文件,由COST Action项目构建,为欧洲文学远程阅读研究提供支持。 文件详解 文件名称: README.md 文件格式: Markdown (.md) 内容:...
    packageimg
  • 提格利尼亚语语言建模数据集TLMD_v1_0_0

    2025年12月13日 30 109 51

    数据集概述 该数据集是为提格利尼亚语语言建模构建的单语种数据集,是同类数据中规模最大的提格利尼亚语数据集。数据经轻量清理,包含训练集(百分之九十八)和验证集(百分之二),支持自然语言处理研究。 文件详解 文件名称: tlmd_v1.0.0.zip 文件格式: ZIP压缩包 数据结构:...
    packageimg
  • 加泰罗尼亚政府网页爬取语料库2020

    2025年12月13日 30 190 122

    数据集概述 该数据集是2020年9月至10月从加泰罗尼亚政府.gencat域名及子域名爬取的加泰罗尼亚语网页语料库,含三千九百一十一万七千九百零九个词元、一百五十六万五千四百三十三个句子和七万一千零四十三篇文档,是加泰罗尼亚语文本语料库的子语料库。 文件详解 文件名称: catalan_government_crawling.zip 文件格式: ZIP...
    packageimg
  • 中世纪穆斯林非洲之角城市化与逆城市化进程补充材料_Handoga_吉布提_案例

    2025年12月12日 30 47 32

    数据集概述 本数据集为中世纪穆斯林非洲之角城市化与逆城市化进程研究的补充材料,聚焦Handoga(吉布提)与Fardowsa(索马里兰)的住宅结构句法分析数据,包含压缩文件、说明文档及分析计划图片,为相关历史地理研究提供数据支持。 文件详解 文档文件: Readme - Complementary...
    packageimg
  • 俄语提升诊断中的习语与分句句法研究

    2025年12月12日 30 94 79

    数据集概述 该数据集为一篇研究论文,聚焦现代俄语中提升与控制结构的区分,以习语片段为诊断工具,验证习语片段在提升谓词中保留、在控制谓词中不保留的预测,并探讨俄语习语内部句法及非句法适切条件对诊断的限制。 文件详解 数据集包含一个PDF格式的文档文件,具体如下: - 文件名称:...
    packageimg
  • 图皮语依存树库数据集

    2025年12月9日 30 33 19

    数据集概述 本数据集是图皮语依存树库(TuDeT),包含一个压缩文件,提供图皮语语言资源,用于自然语言处理(NLP)相关研究,为图皮语的句法分析提供数据支持。 文件详解 文件名称: tupian-language-resources/tudet-v0.4.zip 文件格式: ZIP(压缩文件) 内容说明:...
    packageimg
  • 俄语词序百科条目2014

    2025年12月7日 30 28 11

    数据集概述 本数据集为2014年发表于《大俄罗斯百科全书》第28卷的“Порядок слов(词序)”条目。内容涵盖俄语词序分析的基础框架,区分词序的限制性与非限制性方面,为俄语语法及词序研究提供权威参考。 文件详解 文件名称: WORD ORDER _ENCYCL 2014.pdf 文件格式: PDF (.pdf) 文件内容:...
    packageimg
  • 多成分复合句综合分析数据集

    2025年12月7日 30 8 7

    数据集概述 该数据集围绕多成分复合句展开综合分析,核心内容为一份PDF格式的研究文档,为语法结构、句子类型等语言研究方向提供基础资料。 文件详解 文件名称:Nazarova Sevarakhon Jakhongir kizi.pdf 文件格式:PDF 内容说明:包含关于多成分复合句的综合性分析内容,具体字段或章节需通过文档阅读获取 适用场景...
    packageimg
  • 语言句法子系统及其单位的通用语言学研究

    2025年12月5日 30 93 60

    数据集概述 本数据集为一份关于语言句法子系统及其单位的通用语言学研究文档,以PDF格式呈现,聚焦于从通用语言学视角对语言句法子系统及其构成单位的分析与探讨。 文件详解 文件名称: Khoshimov G.M..pdf 文件格式: PDF (.pdf) 文件内容: 该文档是关于语言句法子系统及其单位的通用语言学研究资料,具体内容需通过阅读PDF文档获取。...
    packageimg
  • 古俄语附着词空间研究及扎利兹尼亚克著作评述

    2025年12月5日 30 119 3

    数据集概述 本数据集为一篇评述性文献,围绕俄罗斯语言学家安德烈·扎利兹尼亚克2008年著作《古俄语附着词》展开,对比其1993年关于古俄语存在瓦克纳格尔定律的研究,探讨古俄语口语与书面语附着词系统的关系、多维分类方法及韵律与句法分析视角的差异。 文件详解 文件名称:2009-1_259-277.pdf 文件格式:PDF(.pdf)...
    packageimg
  • 文本结构化分析多语言数据集

    2025年9月27日 30 6 0

    文本结构化分析多语言数据集_Text_Structural_Analysis_Multilingual_Dataset 数据来源:互联网公开数据 标签:文本分析, 语言学, 结构化数据, 句法分析, 自然语言处理, 多语言, 深度学习, 文本特征 数据概述:...
    packageimg
  • 梵文关系数据集

    2025年6月1日 30 197 30

    梵文关系数据集 数据来源:互联网公开数据 标签:梵文,句法分析,语料库,关系数据,NLP,语言学研究,文本分析 数据概述: 本数据集基于CoNLL-U格式文件构建,将原始的结构化文本数据转换为关系型数据格式,并存储为 Feather 文件以提高数据处理的效率和灵活性。数据集包含两个主要文件:words.feather 和...
    packageimg
  • 自然语言理解COLA数据集训练与测试NaturalLanguageUnderstandingCOLADatasetTrainandTest-aryansakhala

    2025年4月29日 30 23 5

    自然语言理解COLA数据集训练与测试NaturalLanguageUnderstandingCOLADatasetTrainandTest-aryansakhala 数据来源:互联网公开数据 标签:自然语言处理, 文本分类, 句法分析, 语言模型, 文本理解, 机器翻译, 语义分析, 训练集 数据概述:...
    packageimg
  • 核心ference数据集CoreferenceDataset-mrdbc29

    2025年4月26日 30 4 3

    核心ference数据集CoreferenceDataset-mrdbc29 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,机器学习,语言模型,句法分析,语义理解,人工智能 数据概述: 该数据集包含来自多个自然语言处理研究项目的文本数据,记录了文本中的核心ference现象。主要特征如下:...
    packageimg
  • 数据5000语料树结构数据集5000ConstituencyandDependencyTreesDataset-pragyanshusingh01

    2025年4月26日 30 189 83

    5000语料树结构数据集5000ConstituencyandDependencyTreesDataset-pragyanshusingh01 数据来源:互联网公开数据 标签:语料库,句法分析,依存句法,数据集,自然语言处理,人工智能,语言学,计算机科学...
    packageimg
  • 句子类型分类数据集SentenceTypes-Question-Command-andStatementDataset-brijeshgzp05

    2025年4月24日 30 48 45

    句子类型分类数据集SentenceTypes-Question-Command-andStatementDataset-brijeshgzp05 数据来源:互联网公开数据 标签:自然语言处理,句法分析,数据集,文本分类,机器学习,语言学研究,人工智能,教育技术 数据概述:...
    packageimg
  • 土耳其语通用依存树库数据集TurkishUniversalDependenciesDataset-emirkaanozdemr

    2025年4月23日 30 4 3

    土耳其语通用依存树库数据集TurkishUniversalDependenciesDataset-emirkaanozdemr 数据来源:互联网公开数据 标签:语言学,依存句法,自然语言处理,土耳其语,数据集,句法分析,语言资源,机器学习 数据概述: 该数据集包含土耳其语的通用依存树库,记录了土耳其语文本的依存句法结构。主要特征如下:...
    packageimg
  • 语言分类数据集

    2025年4月14日 30 171 23

    语言分类数据集 数据来源:互联网公开数据 标签:语言分类,多语言数据集,机器学习,深度学习,自然语言处理,句法分析 数据概述:...
    packageimg