数据集概述
本数据集包含意大利504,038个使用Google Analytics的网站域名分析结果,涵盖第三方请求、Cookie等隐私相关特征,提供495,663个域名的用户/属性ID及MX、TXT记录,为意大利网站隐私实践研究提供数据支持。
文件详解
- 文档文件:
- README.txt:TXT格式,说明数据集内容、隐私分析背景及数据使用指引
- 2022-08-08_GA_domains.txt:TXT格式,包含意大利使用Google Analytics的网站域名列表
- 2022-07_GA_domains.TXT.txt.bz2:压缩TXT格式,2022年7月收集的相关域名数据
- 压缩数据文件:
- ospedaleniguarda.it.json.bz2:压缩JSON格式,单个网站(ospedaleniguarda.it)的详细分析结果
- 2022-07_GA_domains_ids.csv.bz2:压缩CSV格式,2022年7月域名对应的用户/属性ID数据
- 2022-08-08_GA_domains_ids.csv.bz2:压缩CSV格式,2022年8月域名对应的用户/属性ID数据
- 2022-07_GA_domains.MX.txt.bz2:压缩TXT格式,2022年7月域名的MX记录数据
- 2022-07_GA_domains.txt:TXT格式,2022年7月收集的意大利使用Google Analytics的网站域名列表
- 压缩归档文件:
- limesurvey_survey_111742.zip:ZIP格式,可能包含用于数据收集的LimeSurvey调查问卷文件
适用场景
- 意大利网站隐私合规研究:分析网站对Google Analytics的使用情况及隐私保护措施
- 第三方服务依赖分析:研究意大利网站对Google Analytics等第三方工具的依赖程度
- 域名系统特征研究:基于MX、TXT记录分析意大利网站的域名配置规律
- 网络安全与隐私实践评估:评估意大利网站在Cookie使用、数据追踪等方面的隐私实践