-
莱布尼茨语言中心MAIN叙事语料库
2025年12月12日 30 183 107
数据集概述 本数据集是莱布尼茨普通语言学中心收集的叙事语料库,包含俄语-德语、土耳其语-德语双语儿童基于MAIN工具的口语叙事转录,覆盖幼儿园至小学三年级的纵向数据,采用CHAT格式存储,支持叙事能力的宏微观结构分析。 文件详解 压缩文件: Leibniz-ZAS_narrative_corpus_MAIN_0.1.0.zip:...
-
PERSONA-CHAT对话数文本据集
2024年11月10日 30 141 5
PERSONA-CHAT 数据集,这是一个新的对话数据集,由随机配对的众包工作人员之间的 162,064 个话语组成 并且每个人都要求扮演给定的角色(随机分配,由另一组众包创建)。配对的工人被要求自然地聊天,并在谈话中相互了解。这会产生有趣且引人入胜的对话,我们的代理可以尝试学习模仿。



