数据集

儿童书籍文本分类数据集Children-sBookTextClassificationDataset-dooozo

数据来源：互联网公开数据

标签：文本分类, 儿童文学, 叙事文本, 图神经网络, 图结构数据, 情感分析, 机器学习, 数据集构建

数据概述：该数据集包含来自儿童书籍的文本数据，记录了书籍的描述信息，用于文本分类和图神经网络研究。主要特征如下：时间跨度：数据未标明具体时间，视作静态文本语料数据集使用。地理范围：数据来源未明确，但文本内容为英文，推测为英语文学作品。数据维度：包括“text”（书籍描述文本）、“category”（书籍分类）、“label”（情感标签，可能用于情感分析任务）、“node_id”（节点ID，用于构建图结构）、“neighbour”（邻居节点信息，用于图结构构建）等字段。数据格式：数据集包含CSV格式的文本数据文件（train.csv, test.csv, Children.csv）以及一个.pt文件（Children.pt，可能为PyTorch模型或中间数据）。

数据用途概述：该数据集具有广泛的应用潜力，特别适用于以下场景：研究与分析：适用于儿童文学、自然语言处理、图神经网络等领域的学术研究，如儿童书籍分类、情感分析、基于图结构的文本分析。行业应用：可以为教育科技公司、儿童内容平台提供数据支持，例如用于书籍推荐、内容筛选、智能分级等。决策支持：支持教育领域的内容管理和个性化推荐系统开发。教育和培训：作为自然语言处理、机器学习、图神经网络等课程的实训素材，帮助学生理解文本分类、情感分析等任务。此数据集特别适合用于探索儿童书籍的文本特征与分类之间的关系，以及基于图结构的文本表示学习，帮助用户实现文本分类、情感分析等目标。

数据与资源

versions_20250311095446.zipZIP
83.06 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	83.06 MiB
最后更新	2025年5月31日
创建于	2025年5月31日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。