-
PPORTAL_Annotated_Portuguese_Literary_Entities_NER语料库
2025年12月31日 30 30 23
数据集概述 本数据集为葡萄牙文学实体标注语料库,适配巴西和葡萄牙文学文本,包含PER、LOC、GPE、ORG、DATE五类实体标注。语料源自25部不同作者与风格的文学作品,含125,059个标记和5,266个标注实体,用于支持葡萄牙语NER模型开发及文学领域探索。 文件详解 文件名称:pportal-selective.json 文件格式:JSON...
-
巴西葡萄牙语文学语料库数据集
2025年4月17日 30 134 109
巴西葡萄牙语文学语料库数据集 数据来源:互联网公开数据 标签:巴西文学,葡萄牙语,文学语料库,文本分析,主题识别,作者归属,历史文本,文化研究 数据概述 本数据集收录了1840年至1908年间巴西文学作品,内容涵盖超过370万字的葡萄牙语文本,涉及81部独立作品。这些作品由多位知名巴西作家创作,包括阿道福·坎尼亚(Adolfo...



