数据10000条独特医疗推文数据集

数据10000条独特医疗推文数据集 数据来源:互联网公开数据 标签:医疗推文,糖尿病,癌症,心理健康,自然语言处理,NLP,机器学习,情感分析 数据概述: 本数据集包含100,000条与医疗状况相关的推文,涵盖糖尿病、癌症和心理健康等多个方面。推文通过结合使用Twitter上的特定标签和关键词进行收集,并被标记为与医疗状况相关或不相关。每个推文条目包含唯一标识符、关键字、位置、文本内容和目标标签。目标标签用于指示推文是否涉及真实的医疗状况(1表示相关,0表示不相关)。 数据用途概述: 该数据集适用于自然语言处理(NLP)领域的研究项目,特别是与医疗健康相关的研究。研究人员和开发者可以利用此数据集训练机器学习模型,以分类推文是否与医疗状况相关;同时可用于分析与医疗健康相关的推文的语言和情感,为医疗健康领域的NLP应用提供数据支持。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 0.06 MiB
最后更新 2025年4月15日
创建于 2025年4月15日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。