Telugu_Suicide_Based心理健康检测泰卢固语文本数据集

数据集概述

本数据集是Kaggle英文自杀检测数据集前5万行的泰卢固语翻译版,使用IndicTrans2翻译模型生成。核心内容为含自杀倾向标注的泰卢固语文本,每条数据包含文本内容及“自杀倾向”或“非自杀倾向”的分类标签,旨在支持泰卢固语心理健康检测相关研究,共包含2个文件。

文件详解

  • README.md
  • 文件格式:MD
  • 字段映射介绍:包含数据集描述,说明其为Kaggle英文自杀检测数据集的泰卢固语翻译版、翻译模型、数据规模及分类标签定义等信息。
  • Synthetic_Telugu_Dataset.xlsx
  • 文件格式:XLSX
  • 字段映射介绍:包含前5万行泰卢固语翻译文本数据,每条数据含文本内容字段及分类标签字段(标注为自杀倾向或非自杀倾向)。

数据来源

Kaggle英文自杀检测数据集(https://www.kaggle.com/datasets/nikhileswarkomati/suicide-watch

适用场景

  • 泰卢固语心理健康检测模型训练:用于训练识别泰卢固语文本中自杀倾向的分类模型。
  • 多语言情感分析研究:作为泰卢固语分支数据,支持多语言心理健康文本分析的对比研究。
  • 自杀倾向文本特征提取:分析泰卢固语自杀倾向文本的语言特征及表达模式。
  • 心理健康辅助工具开发:为泰卢固语地区的心理健康筛查工具提供数据支撑。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 11.16 MiB
最后更新 2026年2月6日
创建于 2026年2月6日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。