-
FeatureTTS_Based_音系特征映射数据
2026年1月31日 30 86 35
数据集概述 本数据集为FeatureTTS相关的音系特征映射数据,包含APRAbet与SAMPA、拼音与SAMPA-SC、SAMPA/SAMPA-SC与基于FUL的音系特征之间的映射关系,用于语音合成领域的音系特征转换与处理。 文件详解 文件名称:CMU2SAMPA_Pinyin2SAMPA_SAMPA2Features.xlsx 文件格式:XLSX...
-
Schuessler_Appendix_汉代外来名称与词汇转写数据集
2026年1月23日 30 32 3
数据集概述 本数据集包含汉代文献中外来名称与词汇的中文转写内容,源自Axel Schuessler 2014年论文的附录。数据覆盖先秦、西汉、东汉三个时期,记录了外来词的汉字形式、拼音、上古音重构、时间、出处、释义等信息,共8个文件,支持历史语言学领域的汉代语言接触研究。 文件详解 数据文件(共6个) 先秦时期文件:1...
-
BDRC_Biographical_Dictionary_of_Republican_China_三类索引数据
2025年12月28日 30 44 22
数据集概述 本数据集为《民国人物传记词典》(BDRC)提取的三类索引文件,包含人物、机构、地点索引。人物索引含原始译名、汉字及拼音;机构索引以英文为主;地点索引为原始译名形式。共3个文件,支持民国史相关人物、机构、地点信息的检索与关联。 文件详解 人物索引文件 文件名称:Index_Persons.xlsx 文件格式:XLSX...
-



