-
西班牙语自杀倾向文本数据集
2025年4月20日 30 166 139
西班牙语自杀倾向文本数据集 数据来源:互联网公开数据 标签:心理健康, 自杀倾向, 抑郁症, 社交媒体文本, Reddit, 情感分析, 西班牙语 数据概述: 本数据集由Reddit平台上的“SuicideWatch”和“depression”两个子论坛中的帖子组成,使用Pushshift... -
社交媒体Twitter巴西葡萄牙语情感分析数据集
2025年4月15日 30 28 27
社交媒体Twitter巴西葡萄牙语情感分析数据集 数据来源:互联网公开数据 标签:情感分析,葡萄牙语,巴西,社交媒体文本,自然语言处理,文本分类,情绪识别 数据概述 本数据集为 Caramelo-Smile-V3 模型的情感分析训练数据,完全基于巴西葡萄牙语(PT-BR)。数据集构建自 Twitter... -
阿拉伯语方言数据集
2025年4月14日 30 99 46
阿拉伯语方言数据集 数据来源:互联网公开数据 标签:阿拉伯语方言,社交媒体文本,文本分类,语言分析,自然语言处理,区域语言差异 数据概述: 本数据集来源于Twitter平台,包含38,394条记录,主要分为四类阿拉伯语方言,分别为埃及方言、海湾方言、约旦方言和也门方言。各类别数据分布不均衡,为研究人员提供了多样化的数据资源。 数据用途概述:... -
来自Twitter的阿拉伯语讽刺推文数据集
2025年4月14日 30 85 69
来自Twitter的阿拉伯语讽刺推文数据集 数据来源:互联网公开数据 本数据集由 Abufarha 等研究者在 WANLP 2021 Shared Task 中发布,旨在推动阿拉伯语自然语言处理领域中讽刺识别与情感分类任务的研究。项目地址:https://github.com/iabufarha/ArSarcasm-v2 数据内容: 数据集收集自...