数据集概述
该数据集包含1900年至今北京方言单字调的原始提取数据,来源于早期录音资料和实验研究结果,为分析北京方言声调的历史演变提供实证数据支持。
文件详解
该数据集以压缩包形式提供,具体说明如下:
- 压缩包文件:
- EL-CL/beijing-tones-since-1900-v1.0.zip: ZIP格式压缩包,包含所有提取的CSV数据文件
- 内部CSV数据文件(按来源分类):
- 1900年录音提取数据: 1900 Azoulay, 1st take.csv、1900 Azoulay, 2nd take.csv
- 1920年录音提取数据: 1920 Wang.csv
- 1922年录音提取数据: 1922a Chao.csv
- 1930年录音提取数据: 1930 Shu.csv
- 1933年录音提取数据: 1933 Pai.csv
- 1915年实验提取数据: 1915 Karlgren.csv
- 1922年实验提取数据: 1922c Chao.csv
- 1925年实验提取数据: 1925 Liu.csv
- 1934年实验提取数据: 1934 Obata & Tesima.csv、1934 Pai.csv
- 1998年现代数据: 1998 Lin et al..csv
- 2003年现代数据: 2003 Sanders & Shi.csv
- 通用字段映射:
- Item: 样本来源的不同部分标识
- Character: 对应音节的汉字(如适用)
- Pinyin: 音节拼音(无调号,如适用)
- Tone: 音节声调编号
- Duration: 音节时长(单位ms,赵元任1922c除外)
- P1至P30: 音节时长内30个均匀分布测量点的基频(单位Hz)
适用场景
- 方言语音学研究: 分析1900年至今北京方言单字调的演变规律
- 历史语言学分析: 探究社会变迁对语言声调系统的影响
- 语音数据对比: 对比不同历史时期北京方言声调的声学特征差异
- 汉语声调演变研究: 为汉语声调系统的历史发展提供实证案例
- 语音档案数字化应用: 验证早期录音资料在语言研究中的应用价值