找到2个数据集

标签: 多语言训练

过滤结果
  • NorMedQA_Based挪威医疗问答基准数据集

    2026年2月9日 30 8 2

    数据集概述 本数据集为挪威医疗问答基准数据集(NorMedQA),包含1313条纯文本医疗问答对和1401条含图片的医疗问答对(图片版本仍在开发中),主要使用挪威语(书面挪威语和新挪威语),用于评估大语言模型在挪威医疗场景下的知识检索与推理能力。数据源于公开医疗考试问题,经清洗预处理,以JSON格式存储。 文件详解...
    packageimg
  • 写作者数据集

    2025年4月14日 30 205 83

    写作者数据集 数据来源:互联网公开数据 标签:写作者,自然语言处理,文本分类,审计,多语言训练 数据概述: 本数据集包含从1963年至2021年间关于写作者的文本记录,文本主要以俄语撰写。数据集涵盖了各种类型的文档,包括但不限于文章、报告等,为自然语言处理和文本分类提供了丰富的训练素材。 数据用途概述:...
    packageimg