数据集概述
本数据集为研究“基础生物医学研究中机器人实验室使用指标”的文章配套数据,包含论文标注统计结果、期刊列表、方法频率统计等文件,采用2015年医学主题词表(MeSH)进行标注,支持机器人实验室方法在生物医学领域应用潜力的分析。
文件详解
该数据集包含15个文件,按类型分组说明如下:
- 数据文件(10个):
- 方法统计类CSV文件:如metamapMethods.csv、sodaMethods.csv、metamapMethodFrequency.csv、sodaMethodFrequency.csv(记录方法名称及频次,示例字段:label、SoDA)
- 论文与期刊信息类文件:article_pii_dois.csv(论文标识)、journal-list-issn.csv(期刊名称与ISSN)
- MeSH相关Excel/CSV文件:cloudlab_mesh_withIDS_expanded.xlsx、cloudlab_mesh_withIDS_expanded_longform.csv、cloudlab_methods_full_list.xlsx(MeSH术语及方法列表)
- 技术层级文件:investigative-technique-hierarchy-sparql.txt(含SPARQL查询语句)
- 代码文件(4个):
- Jupyter Notebook文件:MethodIndexingWithMESHMetaMap.ipynb、AutomatedMethodIndexingWithMESHLower.ipynb、NERcompViz.ipynb(方法索引与可视化代码)
- Python脚本:get_articles_xml.py(获取论文XML数据的代码)
适用场景
- 生物医学方法研究:分析机器人实验室方法在生物医学论文中的应用频率与分布
- 文献计量学分析:探究MeSH术语标注下的实验方法学术趋势
- 科研工具评估:评估机器人实验室技术在基础生物医学研究中的应用潜力
- 数据可视化研究:基于方法频率数据开展生物医学方法可视化分析