英语单词重音位置分析数据集

英语单词重音位置分析数据集 数据来源:互联网公开数据 标签:英语单词,重音位置,语音学,语言分析,词性标注,音节数量,数据分析 数据概述: 本数据集是为研究英语单词重音位置规律而创建的一个副产品,基于包含30余万个英语单词的原始数据集。通过使用一个免费的词典API获取单词的音标,并从中提取音节数量、重音位置和重音音节,形成了这个新的数据集。数据集包含约3万个单词的音标信息。 数据用途概述: 该数据集适用于语音学研究、语言分析、词性标注、音节数量统计等场景。研究人员可以利用此数据集研究英语单词的重音规律;语言教师可以借助数据进行教学辅助;自然语言处理领域的从业者可以使用数据集开发相关算法。此外,数据集也适合用于教育培训,帮助学习者了解英语单词的重音规则。 文件描述: words_stress_analyzed.csv为最终的数据集文件。其他文件为数据处理过程中的中间步骤。 列描述: 单词:字符串,例如“complimentary”,表示英语单词。 音标:字符串,例如“/ˌkɒmplɪ̈ˈment(ə)ɹɪ/”,表示单词的音标。 词性:字符串列表,例如['adjective'],表示单词在句子中的使用情况。 音节数量:整数,例如5,表示单词包含的音节数量。 重音位置:整数,例如3,表示重音落在哪个音节上,如果有多个重音,则表示第一个重音的位置。 重音音节:字符串,例如“e”,表示重音音节中的元音。 注意:某些短单词缺少重音符号导致数据集中存在空白。建议过滤掉重音音节为空的行以及音节数量为1的行。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 1.11 MiB
最后更新 2025年4月14日
创建于 2025年4月14日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。