汉语Callhome与Callfriend语料库非完成体结构标注数据集

数据集概述

本数据集是对汉语Callhome和Callfriend口语语料库中的非完成体结构进行标注的数据集,包含标注后的口语对话文本及相关语言学特征信息,为研究汉语口语中非完成体的使用规律提供数据支持。

文件详解

  • 文件名称:Imperfectives in Chinese Callhome and Chinese Call/combined_data.csv
  • 文件格式:CSV
  • 字段示例:
  • Num:编号
  • Conver_Num:对话编号
  • Prog_Num:进行体编号
  • Content:文本内容
  • Source:语料来源
  • Func:功能标注
  • Corp:语料库标识

数据来源

talkbank.org

适用场景

  • 汉语语言学研究:分析口语中非完成体结构的分布特征与使用规律
  • 计算语言学研究:构建汉语非完成体识别或标注的训练数据
  • 语料库语言学分析:探究口语对话中语法结构与语境的关联
  • 对外汉语教学研究:为口语语法教学提供真实语料案例支持
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.02 MiB
最后更新 2025年11月29日
创建于 2025年11月29日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。