FDA加速审批文件监管信号数据集

数据集概述

该数据集包含美国食品药品监督管理局(FDA)授予加速审批(AA)的药品相关监管文件,覆盖224个申请级文件集,包含原始文档及提取的文本内容,为后续信号提取和分析提供基础数据。

文件详解

数据集主要包含3个压缩文件,具体说明如下: - 目录文件: - fda_documents_v2.zip:包含按申请号分类的原始文档(PDF、CFM/HTML格式)及对应的提取文本文件(.txt格式),文档类型包括审批函、草案标签、摘要审查报告、180天进展报告 - fda_code_v1.zip:未提供具体内容说明 - fda_code_v2.zip:未提供具体内容说明 - 提取信息: - 每个申请的文档集包含原始文本内容(.txt文件)及基础统计信号(如置信区间、p值、统计方法提及)的.json文件

数据来源

美国食品药品监督管理局(FDA)

适用场景

  • 监管情报自动化研究:构建FDA加速审批文件的机器可读语料库
  • 自然语言处理模型开发:训练提取监管信号的NLP模型
  • 机器学习算法训练:预测加速审批结果的ML或量子分类算法
  • 监管政策分析:研究监管语言和要求的演变趋势
  • 临床信息学研究:分析FDA决策过程的透明化模型构建
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 9.76 MiB
最后更新 2025年11月28日
创建于 2025年11月28日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。