找到1个数据集

标签: scrapepdfspy

过滤结果
  • CGU_Website_Based_巴西联邦审计法院审计报告原始文本数据集_2020

    2026年1月18日 0 209 141

    数据集概述 本数据集包含巴西联邦审计法院(CGU)网站发布的审计报告原始文本,2020年通过脚本scrape_pdfs.py抓取,用于论文“机器学习在反腐败政策分析与支持中的应用”研究。现CGU网站结构变更导致爬虫失效,但报告仍可手动获取,含2个文件。 文件详解 scrape_pdfs.py 文件格式:.py...
    packageimg