冠状病毒科学文献动态主题模型标签数据集

数据集概述

本数据集包含基于论文提出的无监督标签技术生成的动态主题模型(DTM)标签,涵盖100个和200个主题模型,分别使用全语料库和仅COVID-19时期数据训练,为冠状病毒科学文献的主题分析提供标签支持。

文件详解

  • 文件名称:REPORT_ALL_200.html,文件格式:HTML,内容为使用全语料库训练的200个主题模型的标签报告
  • 文件名称:REPORT_COVID_200.html,文件格式:HTML,内容为仅使用COVID-19时期数据训练的200个主题模型的标签报告
  • 文件名称:REPORT_ALL_100.html,文件格式:HTML,内容为使用全语料库训练的100个主题模型的标签报告
  • 文件名称:REPORT_COVID_100.html,文件格式:HTML,内容为仅使用COVID-19时期数据训练的100个主题模型的标签报告

适用场景

  • 医学文献分析:用于解析冠状病毒相关科学文献的主题分布与演化趋势
  • 自然语言处理研究:可作为动态主题模型无监督标签技术的验证数据
  • 公共卫生研究:辅助分析COVID-19时期与全时期文献的主题差异
  • 信息检索优化:为冠状病毒文献的主题分类与检索提供标签支持
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 12.92 MiB
最后更新 2025年12月6日
创建于 2025年12月6日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。