合成南非语故事数据集

合成南非语故事数据集

数据来源:互联网公开数据

标签:合成数据,南非语,儿童故事,道德价值,自然语言处理,文本生成,语言模型训练

数据概述: 本数据集包含564篇由合成技术生成的南非语儿童短篇故事,每篇故事均包含明确的道德主题。数据集以CSV格式存储,并附带所有故事的英文翻译。主要字段包括故事内容及其最终版本的“final_draft”列,以及对应的英文翻译。

数据用途概述: 该数据集适用于多种场景,包括语言模型的训练与优化、机器翻译研究、儿童文学内容生成,以及南非语语言与文化研究。研究人员可利用此数据集进行模型训练,提升南非语文本生成的质量;教育机构可将其用于儿童阅读材料开发;文化研究者可分析南非语儿童故事中的道德主题及其表达方式。此外,该数据集也适合用于评估和改进跨语言理解与生成技术。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 197.59 MiB
最后更新 2025年6月1日
创建于 2025年6月1日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。