中古荷兰语词汇重音模式与音节划分数据集

数据集概述

该数据集包含四万八千二百一十九个中古荷兰语词汇,均取自《中古荷兰语》光盘(1998年版)收录的二百零五篇韵文文本。所有词汇均标注了音节划分结果和词汇重音模式,为中古荷兰语语音特征研究提供基础数据。

文件详解

  • 压缩JSON文件(middle_dutch_stresses.json.zip):压缩格式,为机器学习算法提供输入数据,用于训练中古荷兰语多音节词的自动音节划分与重音标注模型。
  • Excel文件(stress_patterns_in_data.xls):Excel格式,包含与JSON文件相同的数据内容,便于直观查阅和参考。
  • 压缩分割文件(splits.zip):压缩格式,用于上述机器学习实验的训练过程。
  • PDF文件(data_insights.pdf):PDF格式,包含数据集内容的说明性图表,提供数据相关的洞察信息。

适用场景

  • 中古语言学研究:分析中古荷兰语词汇的音节结构与重音分布规律
  • 计算语言学应用:开发中古荷兰语语音特征自动标注的机器学习模型
  • 历史语音学分析:探究中古荷兰语语音系统的演变特征
  • 语料库语言学研究:为中古荷兰语文本处理提供标注化词汇资源
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 6.44 MiB
最后更新 2025年12月21日
创建于 2025年12月21日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。