-
CommonsenseQA文本问答数据集
CommonsenseQA 是常识问答任务的数据集。该数据集由 12,247 个问题组成,每个问题有 5 个选项。数据集是由 Amazon Mechanical Turk 工作人员在以下过程中生成的(括号中提供了一个示例):人群工作人员从 ConceptNet(“河流”)和三个目标概念(“瀑布”、“桥梁”、“ Valley”)都通过相同的... -
XQuAD
XQuAD(Cross-lingual Question Answering Dataset)是评估跨语言问答性能的基准数据集。该数据集包含来自 SQuAD v1.1(Rajpurkar 等人,2016 年)开发集的 240 个段落和 1190... -
-
企业-气候风险披露、词频文本分析数据(2007-2022)
企业气候风险披露是指企业通过一定的方式,将气候变化对其影响、自身采取的应对措施等信息披露出来。这有助于投资者更准确地评估企业价值,发现投资机会,规避投资风险。解企业在气候风险方面的关注度和披露情况。... -
NLP-THUCNews新闻文本分类数据集
本数据集包含体育, 财经, 房产, 家居, 教育, 科技, 时尚, 时政, 游戏, 娱乐,每个分类6500条,总共65000条新闻数据。