CORD-19研究设计内容数据集-davidmezzetti

CORD-19研究设计内容数据集-davidmezzetti 数据来源:互联网公开数据 标签:CORD-19,研究设计,预训练模型,机器学习,元数据,样本量,抽样方法,统计信息,科研,教育

数据概述: 本数据集包含用于检测研究设计和其他元数据字段(如样本量、抽样方法和研究统计信息等)的训练数据和预训练模型。该数据集包含两组训练数据,这些数据将定期更新。设计.csv文件包含1000多篇标注的研究文章,每个文章有10种不同的标签,包括系统综述、随机对照试验、非随机试验、前瞻性观察性研究、时间至事件分析、回顾性观察性研究、横断面研究、病例系列、建模、其他。attribute.csv文件包含1000多条标注的句子,每个句子有4种不同的标签,包括统计信息、抽样方法、样本量、其他。attribute和design文件是二进制预训练模型,适用于与提供的代码结合使用。

数据用途概述: 该数据集适用于研究设计分析、元数据提取、科研教学和教育等场景。研究人员可以利用这些模型进行研究设计的自动分类和元数据字段的识别;教育者可以使用这些数据集进行教学和演示;科研机构可以利用这些数据集进行初步的数据探索和模型训练。此外,这些预训练模型也为高能物理教育和科普提供了有价值的数据资源。

数据与资源

附加信息

字段
版本 1.0
最后更新 四月 22, 2025, 19:49 (UTC)
创建于 四月 22, 2025, 19:49 (UTC)