数据1000个故事100个题材数据集

数据1000个故事100个题材数据集 数据来源:互联网公开数据 标签:故事,题材,文本分析,自然语言处理,文本分类,文学研究 数据概述: 本数据集包含1000个故事,跨越100个不同的题材。每个故事以表格形式存储在一个数据框中,数据框中包含每个故事的唯一标识符、标题、内容和题材信息。题材列表可以在genres.txt文件中找到。数据框的结构包括:id(唯一标识符)、title(标题)、story(内容)和genre(题材)。平均每个标题包含6个单词,每个故事包含960个单词。 数据用途概述: 该数据集适用于文本分析、自然语言处理、文本分类和文学研究等多种应用场景。研究人员可以利用此数据集进行题材分类、故事内容分析和语言特征提取等任务;教育机构可以将其用于文学课程的教学示例;内容创作者可以参考数据集中的题材分布和故事结构进行创作;机器学习工程师可以使用数据集训练文本分类模型等。此外,数据集也适合用于教育培训,帮助学习者理解和分析不同类型故事的特点。 许可证: 本数据集采用cc-by-2.0许可证。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 1.8 MiB
最后更新 2025年4月14日
创建于 2025年4月14日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。