西雅图市议会公告主题流行度数据集
数据来源:互联网公开数据
标签:西雅图,市议会,公告,主题分析,流行度,政策研究,数据分类,时间序列,城市治理
数据概述:
本数据集包含了超过2000条西雅图市议会的官方公告记录,时间跨度从2014年到2024年。每条记录代表一个市议会的正式公告,内容涉及公告的具体主题、发布时间等信息。数据经过预处理和标准化,使用了零样本分类模型(https://huggingface.co/BAAI/bge-reranker-v2-m3)对公告主题进行了分类。原始分类结果通过sigmoid激活函数(归一化)处理,并进一步转换为高斯分布形式(使用公式:0.5 * log(p / (1 - p))),最后进行了标准化,使其均值为0、方差为1,以确保数据的可解释性和一致性。
数据用途概述:
该数据集适用于多个研究和分析场景:
1. 政策研究与城市治理:研究人员可以利用数据集分析西雅图市议会的关注重点和政策主题随时间的变化趋势,从而深入理解城市治理的优先事项。
2. 主题流行度分析:通过分析不同主题的流行度变化,可以洞察市民关注的热点问题,为相关决策提供数据支持。
3. 时间序列分析:数据集的时间跨度较长,适合用于探索市议会公告主题随时间的演变规律,识别长期趋势或周期性模式。
4. 机器学习与自然语言处理:数据集经过预处理和标准化,可以直接用于训练或验证零样本分类模型,或作为特征输入进行更复杂的模型训练。
5. 城市规划与社区研究:数据集中的公告主题涉及城市规划、公共设施、社区服务等多个领域,有助于研究人员和从业者了解城市的整体发展方向。
该数据集的标准化处理和时间序列特性,使其成为研究西雅图市议会动态和城市治理趋势的重要资源。