找到2个数据集

标签: 葡萄牙语语料库

过滤结果
  • PPORTAL_Annotated_Portuguese_Literary_Entities_NER语料库

    2025年12月31日 30 202 152

    数据集概述 本数据集为葡萄牙文学实体标注语料库,适配巴西和葡萄牙文学文本,包含PER、LOC、GPE、ORG、DATE五类实体标注。语料源自25部不同作者与风格的文学作品,含125,059个标记和5,266个标注实体,用于支持葡萄牙语NER模型开发及文学领域探索。 文件详解 文件名称:pportal-selective.json 文件格式:JSON...
    packageimg
  • 基于大语言模型重写故事的葡萄牙语叙事性别偏见研究数据集

    2025年12月10日 30 194 93

    数据集概述 本数据集为葡萄牙语文学作品语料库,用于研究大语言模型生成叙事中的性别偏见。语料库含五百九十二部作品,经筛选后得两万八千三百一十七个句子、七十七万四千五百一十六个词,作品覆盖不同历史时期与文学风格,每部最多取一百句以平衡分布。 文件详解...
    packageimg