低资源语言监督式词义消歧数据集_Tattbabadhana

数据集概述

该数据集为低资源语言设计,包含基于"监督"(Tattbabadhana)方法的词义消歧(WSD)相关数据,以单一压缩文件形式存储,未提供具体拆分信息。

文件详解

  • 文件名称: Tattbabadhana/nasiruddinetalTaln2015.tgz
  • 文件格式: TGZ压缩文件(.tgz)
  • 内容说明: 压缩文件包含与低资源语言监督式词义消歧相关的数据,具体字段及内容未通过预览提供

适用场景

  • 低资源语言自然语言处理研究: 用于词义消歧算法模型的训练与测试
  • 计算语言学分析: 探索监督学习方法在低资源语言词义消歧任务中的应用效果
  • 多语言处理技术开发: 为低资源语言文本理解相关工具提供数据支持
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 169.43 MiB
最后更新 2025年11月27日
创建于 2025年11月27日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。