ELTeC_hun_Based_匈牙利小说语料库数据2021_04

关注者: 0

资源积分: 30

分类

公开数据

公开数据

授权

没有提供授权

数据集

ELTeC_hun_Based_匈牙利小说语料库数据2021_04

数据集概述

本数据集为ELTeC（欧洲文学文本集）项目下的匈牙利小说语料库2021年4月版本，包含100部编码为1级和2级的小说，总计2个文件，无目录层级结构。数据由欧洲文学历史远程阅读COST行动项目产出，支持欧洲文学的数字化研究。

文件详解

README.md
文件格式：MD
字段映射介绍：包含语料库项目背景、发布说明、维护机构等信息，以及DOI引用标识（10.5281/zenodo.4271637）
ELTeC-hun-2.0.0.zip
文件格式：ZIP
字段映射介绍：压缩包内包含100部匈牙利小说的编码文本，按1级和2级标准编码

数据来源

Centre for Digital Humanities at the Eötvös University of Sciences（ELTE.DH）

适用场景

欧洲文学数字化研究：分析匈牙利小说的文本特征、风格演变及文学历史脉络
计算语言学研究：基于编码文本开展句法分析、语义挖掘等自然语言处理任务
文学语料库构建参考：为多语言文学语料库的编码标准和结构设计提供实例
学术引用与文献支撑：作为欧洲文学远程阅读研究的基础数据资源，支持相关论文发表与项目研究

数据与资源

4662499.zipZIP
111.78 MiB

下载

附加信息

字段	值
作者	Maxj
版本	1
数据集大小	111.78 MiB
最后更新	2026年1月27日
创建于	2026年1月27日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

智能助手

您好！我是海数据平台的智能助手，有什么可以帮助您的吗？