共同基金用户咨询问题分类数据集-aloktantrik
数据来源:互联网公开数据
标签:共同基金,用户咨询,文本分类,自然语言处理,金融科技,数据分析,机器学习,NLP
数据概述:
本数据集包含用户关于共同基金的咨询问题,并按主题进行了分类。数据来源于Reddit和Quora等平台,收录了用户生成的关于各种共同基金相关问题的提问。数据集以CSV格式提供,每条咨询问题都分配有一个基于其主题或类别的特定标签。
数据结构:
数据集包含两列:
labels:分配给查询的类别或标签(例如,SIP、共同基金业绩、税收等)
query:用户生成的关于共同基金的查询文本
列定义:
labels:共同基金查询的类别或标签
query:用户的实际查询文本
示例数据:
labels,query
SIP,"未来10年投资哪个SIP最好?"
共同基金业绩,"如何查看共同基金的过往业绩?"
税收,"共同基金在印度需要纳税吗?规则是什么?"
数据用途概述:
该数据集适用于文本分类、情感分析、自然语言处理(NLP)任务,以及构建预测共同基金相关咨询问题的模型等多种场景。研究人员可以利用此数据进行:
文本分类:使用labels列训练分类模型,对未来的查询进行分类。
NLP:训练模型进行查询理解、自动回复或基于用户问题的的情感分析。