墨西哥总统安德烈斯-曼努埃尔-洛佩兹-奥布拉多演讲数据集

墨西哥总统安德烈斯-曼努埃尔-洛佩兹-奥布拉多演讲数据集 数据来源:互联网公开数据
标签:墨西哥总统,演讲文本,政府政策,政治分析,自然语言处理,文本挖掘,语言模型训练

数据概述:
本数据集包含墨西哥总统安德烈斯·曼努埃尔·洛佩兹·奥布拉多在其任期内公开演讲的语料库。数据来源于墨西哥政府官方 YouTube 频道中所有与本届总统任期相关的 YouTube 视频。数据集包括总统每日早间发布会(mañaneras)的演讲内容,这些演讲通常是即兴的、非正式的。部分演讲的转录文本由 YouTube 自动生成,另一部分则使用 Whisper 工具进行转录。数据集中还包含转录来源的标识信息。

数据用途概述:
该数据集适用于多种研究与应用领域,包括政策研究、政治传播分析、自然语言处理模型训练等。研究人员可以利用该数据集探索墨西哥政府政策的演变、公众沟通策略的变化,以及总统演讲中语言风格的特点。此外,数据集还为语言模型的训练提供了高质量的文本资源,可用于文本生成、摘要、问答等任务的开发与优化。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 156.72 MiB
最后更新 2025年4月18日
创建于 2025年4月18日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。