找到4个数据集

标签: LDA模型

过滤结果
  • 科学教育研究主题建模数据集

    2025年12月10日 30 78 15

    数据集概述 本数据集包含Wiley期刊《Science Education》(前身为《General Science Quarterly》)近百年发表文章的文本数据,经清洗处理后用于自然语言处理分析,特别是潜在狄利克雷分配(LDA)主题建模。数据集包含5577篇1922年后发表的文章文本及相关元数据,并提供Jupyter...
    packageimg
  • 撤回文章定性定量引用分析方法论数据集

    2025年12月8日 30 210 7

    数据集概述 本数据集是《撤回文章的定性定量引用分析:案例研究》方法论应用的成果,包含数据收集阶段的引用实体特征与文本数据集,以及基于引用摘要和上下文的主题建模结果,为撤回文章引用行为研究提供支持。 文件详解 数据集包含一个压缩文件及解压后的子文件,具体说明如下: - 主压缩文件: - method_data.zip:...
    packageimg
  • 儿童言语障碍文献主题建模数据集_LDA与BERTopic

    2025年12月6日 30 161 6

    数据集概述 本数据集及代码用于通过LDA和BERTopic方法分析儿童言语障碍研究论文的主题,数据来源于PubMed并经处理以支持主题建模,为儿童言语障碍领域的文献主题研究提供数据与方法支持。 文件详解 文件名称: speech_disorders_topic_modeling.zip 文件格式: ZIP压缩包(.zip) 文件内容:...
    packageimg
  • 天文学与艺术主题文档主题分析数据集Astronomy-ArtTopicDocumentAnalysisDataset-debankurs

    2025年5月1日 30 40 3

    天文学与艺术主题文档主题分析数据集Astronomy-ArtTopicDocumentAnalysisDataset-debankurs 数据来源:互联网公开数据 标签:主题分析, 文本挖掘, 自然语言处理, 天文学, 艺术, 文档分类, 机器学习, LDA模型 数据概述:...
    packageimg