维多利亚文学数据集

维多利亚文学数据集 数据来源:互联网公开数据 标签:维多利亚文学,情感分析,机器学习,文本分析,文学研究,数据集,自然语言处理 数据概述: 维多利亚文学数据集是一个用于机器学习情感分析的数据集,涵盖了19世纪维多利亚时代的文学作品。数据集包含53,826条记录,每条记录包括两个字段:句子和标签。标签分为五个级别,从0(非常负面)到4(非常正面)。数据集来源于五部不同的小说:查尔斯·狄更斯的《小杜丽特》和《奥利弗·特维斯特》、伊丽莎白·盖斯凯尔的《北与南》、乔治·艾略特的《亚当·贝德》以及玛丽·伊丽莎白·布拉德冬的《艾德莉的秘密》。数据集中最长的句子长度为372个字符。 数据用途概述: 该数据集适用于机器学习模型的训练和评估,特别是在情感分析领域的研究。研究者可以使用该数据集来训练和优化情感分析模型,以提高模型对维多利亚文学作品情感的识别能力。此外,该数据集也可以用于文学研究,帮助研究人员了解和分析19世纪文学作品中的情感表达模式。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 2.09 MiB
最后更新 2025年4月14日
创建于 2025年4月14日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。