全球姓名性别与国家分布数据集-erpel1

全球姓名性别与国家分布数据集-erpel1 数据来源:互联网公开数据 标签:姓名,性别,国家,人口统计,命名,文化研究,语言学,社会学 数据概述: 本数据集包含来自105个不同国家的500万个名字(First Name)和800万个姓氏(Last Name)。 每个名字或姓氏都标注了性别、国家以及在原始数据中的出现次数。 由于大多数名字可能出现在多个国家,并且有时不只属于一种性别,因此一个名字通常对应多行数据。 本数据集的数据来源于 https://github.com/philipperemy/name-dataset?tab=readme-ov-filefull-dataset 。 所有国家/地区的列表可以在 "country_codes.csv" 中找到。

数据用途概述: 该数据集适用于多种研究和应用场景,包括: * 人口统计学研究:分析不同国家和地区的姓名分布、性别比例等。 * 文化研究:研究姓名与文化、语言之间的关系。 * 语言学研究:分析姓名的起源、演变及其在不同语言环境中的表现。 * 社会学研究:研究姓名与社会地位、社会流动性之间的关系。 * 市场营销:用于分析目标客户的姓名特征,进行市场细分和个性化营销。 * 数据可视化:用于创建地图、图表等,直观展示姓名在不同国家/地区的分布情况。 * 姓名生成:用于开发姓名生成器,创建符合特定国家/文化背景的姓名。

数据与资源

附加信息

字段
版本 1.0
最后更新 五月 31, 2025, 15:23 (UTC)
创建于 五月 31, 2025, 15:22 (UTC)