库尔德社交媒体抑郁检测数据集KSO_DD

数据集概述

该数据集包含一万零一百四十五条库尔德索拉尼语社交媒体评论,经预处理并标注用于抑郁检测研究。数据覆盖多平台,通过八列结构记录处理流程,为库尔德语心理健康自然语言处理提供首个专用资源。

文件详解

  • 文件名称: KSO-DD.xlsx
  • 文件格式: XLSX
  • 字段映射:
  • Raw_Comments: 原始评论内容
  • Fields: 提取字段
  • Social_Media_Type: 社交媒体类型(Facebook/Instagram/YouTube)
  • Extraction_Tools: 提取工具
  • Stemmed_Comments: 词干化处理后的评论
  • Comments-without_Stopwords: 去除停用词的评论
  • Cleaned_Comments: 完全处理后的评论
  • Depression: 抑郁标签(二元分类)

适用场景

  • 库尔德语自然语言处理研究: 用于开发方言特异性的抑郁检测模型
  • 心理健康计算语言学: 分析跨平台心理健康话语特征
  • 低资源语言技术: 构建库尔德语文本分类基准
  • 公共卫生研究: 探索库尔德语人群社交媒体中的抑郁表达模式
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 1.18 MiB
最后更新 2025年11月29日
创建于 2025年11月29日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。