数据集

数据1000个故事100个题材数据集

数据1000个故事100个题材数据集数据来源：互联网公开数据标签：故事,题材,文本分析,自然语言处理,文本分类,文学研究数据概述：本数据集包含1000个故事，跨越100个不同的题材。每个故事以表格形式存储在一个数据框中，数据框中包含每个故事的唯一标识符、标题、内容和题材信息。题材列表可以在genres.txt文件中找到。数据框的结构包括：id（唯一标识符）、title（标题）、story（内容）和genre（题材）。平均每个标题包含6个单词，每个故事包含960个单词。数据用途概述：该数据集适用于文本分析、自然语言处理、文本分类和文学研究等多种应用场景。研究人员可以利用此数据集进行题材分类、故事内容分析和语言特征提取等任务；教育机构可以将其用于文学课程的教学示例；内容创作者可以参考数据集中的题材分布和故事结构进行创作；机器学习工程师可以使用数据集训练文本分类模型等。此外，数据集也适合用于教育培训，帮助学习者理解和分析不同类型故事的特点。许可证：本数据集采用cc-by-2.0许可证。

数据与资源

数据1000个故事100个题材数据集.zipZIP
1.80 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	1.8 MiB
最后更新	2025年4月14日
创建于	2025年4月14日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

数据1000个故事100个题材数据集

数据与资源

附加信息

注册成功！