-
HotpotQA维基百科问答数据集
2024年11月10日 120 1 0
HotpotQA 是收集在英语维基百科上的问答数据集,包含大约 113K 众包问题,这些问题的构建需要两篇维基百科文章的介绍段落才能回答。数据集中的每个问题都带有两个黄金段落,以及这些段落中的句子列表,众包工作人员认为这些句子是回答问题所必需的支持事实。 HotpotQA 提供了多种推理策略,包括涉及问题中缺失实体的问题、交叉问题(什么满足属性 A... -
XQuAD
2024年11月10日 30 108 79
XQuAD(Cross-lingual Question Answering Dataset)是评估跨语言问答性能的基准数据集。该数据集包含来自 SQuAD v1.1(Rajpurkar 等人,2016 年)开发集的 240 个段落和 1190... -
FinQA财务文本数据集
2024年11月10日 120 128 78
FinQA 是一个新的大型数据集,由财务专家编写,在财务报告中包含问答对。该数据集包含 8,281 个财务 QA 对,以及它们的数值推理过程。 -
SQuAD (Stanford Question Answering Dataset)问答数据集
2024年11月10日 60 167 165
斯坦福问答数据集 (SQuAD) 是一个阅读理解数据集,由众包工作人员在一组维基百科文章中提出的问题组成,其中每个问题的答案都是相应阅读文章或问题的一段文本或跨度可能无法回答。 -
-
中医治疗新冠流感支原体感染等有效病历集
2025年2月8日 100 163 16
数据集提取了2000多例近期感冒咳嗽病历的中医治疗有效记录,包含新冠、流感、支原体等各种病毒感染。数据分两部分:case为病历记录,diagnosis为从病历提取的诊断结果及处方。病历经过处理,弱化了处方药部分,增加了OTC中成药及食疗的治疗方法,避免开具处方药的资质问题,更适用于轻症的家庭自我诊断调理。数据示例如下:...