NICKLE_Based_韩国英语学习者中介语语料库数据

数据集概述

本数据集为NICKLE(Neungyule韩国英语学习者中介语语料库),含约100万词,包含书面和口语内容(比例约9:1),按主题和交际语境分为不同文本类型。语料库未明确标注 proficiency 水平,主要涵盖基础至中级水平,部分含高级文本,可通过来源大学名称或文本长度识别。

文件详解

  • 文件名称:Basic statistical information of the NICKLE data.xls
  • 文件格式:XLS
  • 字段映射介绍:包含NICKLE语料库的基础统计信息,具体字段未详细说明,推测涵盖语料规模、文本类型分布、词汇量等统计指标。
  • 文件名称:README.txt
  • 文件格式:TXT
  • 字段映射介绍:包含版权声明(基于GNU自由文档许可证1.3版或更高版本)、数据使用说明等重要信息。
  • 文件名称:NICKLE_xml.7z
  • 文件格式:7Z(压缩包)
  • 字段映射介绍:压缩包内为TEI标准的XML格式语料库文件,包含韩国英语学习者的中介语文本数据。
  • 文件名称:NICKLE structure.docx
  • 文件格式:DOCX
  • 字段映射介绍:包含NICKLE语料库的结构说明文档,推测涵盖语料库的组织架构、文本分类规则等内容。

数据来源

NeungYule-Longman English-Korean Dictionary配套资源

适用场景

  • 中介语研究:分析韩国英语学习者的语言特征、错误类型及语言发展规律。
  • 双语词典开发:作为英韩双语词典的补充资源,优化词典释义及用法示例。
  • 语言教学应用:为英语教学提供真实学习者语料,支持教学材料设计与教学方法改进。
  • 自然语言处理:用于训练或测试针对学习者语言的自动标注、错误检测等NLP工具。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 1.61 MiB
最后更新 2026年1月30日
创建于 2026年1月30日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。