XQuAD

XQuAD(Cross-lingual Question Answering Dataset)是评估跨语言问答性能的基准数据集。该数据集包含来自 SQuAD v1.1(Rajpurkar 等人,2016 年)开发集的 240 个段落和 1190 个问答对的子集,以及它们的十种语言的专业翻译:西班牙语、德语、希腊语、俄语、土耳其语、阿拉伯语、越南语、泰语、汉语和印地语。因此,数据集在 11 种语言中完全平行。

数据与资源

附加信息

字段
最后更新 二月 11, 2025, 03:44 (UTC)
创建于 十一月 10, 2024, 16:24 (UTC)