蒙古语词干网络数据集

数据集概述

该数据集包含基于蒙古语语料库构建的三个Neo4j数据库,语料库来源分为文学、政府文件和新闻三类,以.dump格式存储,为蒙古语词干网络相关研究提供数据支持。

文件详解

  • 文件名称:liter.dump
  • 文件格式:.dump
  • 内容说明:基于文学类蒙古语语料库构建的Neo4j数据库文件
  • 文件名称:gov.dump
  • 文件格式:.dump
  • 内容说明:基于政府文件类蒙古语语料库构建的Neo4j数据库文件
  • 文件名称:news.dump
  • 文件格式:.dump
  • 内容说明:基于新闻类蒙古语语料库构建的Neo4j数据库文件

适用场景

  • 蒙古语自然语言处理研究:用于词干提取、词汇网络结构分析等任务
  • 语料库语言学研究:分析不同类型蒙古语文本(文学、政府、新闻)的词干特征差异
  • 知识图谱构建:基于词干网络数据构建蒙古语领域知识图谱
  • 语言资源开发:为蒙古语语言模型训练、词典编纂等提供基础数据支持
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 629.02 MiB
最后更新 2025年11月28日
创建于 2025年11月28日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。