Oupoco_Based_法语十四行诗库_文学创作数据

数据集概述

本数据集是Oupoco项目框架下开发的法语十四行诗库,包含四千八百七十首十四行诗,主要来自十九世纪至二十世纪初。涵盖七百六十七位作者,其中男性作者六百六十位(四千四百一十二首)、女性作者一百零七位(四百三十九首),另有十九首作者性别未明确。数据可免费复用,支持文学研究、语料库分析等多场景应用。

文件详解

  • 文件名称:oupoco.dtd
  • 文件格式:DTD
  • 字段映射介绍:定义XML文件的文档类型,规范十四行诗数据的结构和语法规则,为XML文件提供格式验证依据。
  • 文件名称:sonnets_oupoco_tei.xml
  • 文件格式:XML
  • 字段映射介绍:采用TEI(文本编码倡议)标准编码,包含十四行诗的核心内容,可能涵盖诗歌文本、作者信息、来源信息、版权许可等结构化数据。

数据来源

Oupoco项目(L'Ouvroir de littérature combinatoire),主要来源包括法国国家图书馆等网络及非网络渠道。

适用场景

  • 文学研究:分析十九至二十世纪初法语十四行诗的主题、风格演变及作者群体特征。
  • 语料库语言学:研究法语诗歌的语言结构、韵律规则和词汇使用规律。
  • 数字人文应用:支撑文学文本挖掘、作者归因分析等数字人文领域的研究与教学。
  • 艺术与技术融合:为基于现有诗歌重组创作新作品的项目提供语料基础。
  • 版权与开放数据研究:分析不同来源诗歌的版权许可模式及开放复用机制。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 9.98 MiB
最后更新 2026年1月30日
创建于 2026年1月30日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。