-
Topic_Modeling_Based_女性图书馆员相关文献主题分析数据集
2026年1月20日 30 207 114
数据集概述 本数据集围绕女性图书馆员相关文章的主题建模展开,包含用于NLP分析的代码文件、数据文件及文献检索查询文件,共4个文件,覆盖主题建模的核心过程与数据基础。 文件详解 代码文件 文件名称:Bertopic_Female_Lib.ipynb、scattertext.ipynb 文件格式:.ipynb...
-
Reddit政治用户多主题互动数据集2007_2022
2025年12月18日 30 195 30
数据集概述 本数据集包含2007-2022年Reddit政治子版块的用户互动数据,涵盖每周用户网络及消息数据库。网络中节点为用户,边为互动关系;消息库含主题、毒性、立场等属性,为研究政治话题互动提供支持。 文件详解 文件名称: message_data.zip 文件格式: ZIP压缩包 内容说明:...
-
癌症健康差异驱动因素BERTopic建模与PyCaret评估文本数据集
2025年12月14日 30 78 56
数据集概述 本数据集围绕癌症健康差异驱动因素展开,通过BERTopic建模与PyCaret评估分析PubMed癌症健康差异相关摘要文本。数据经生物信息学工具获取与预处理,聚焦社会、行为等多维度变量对癌症治疗差异的影响,为识别差异驱动因素提供支持。 文件详解 文件名称:...
-
量子技术叙事跨领域分析数据集
2025年12月8日 30 102 8
数据集概述 本数据集为《量子技术叙事:媒体、商业与政策话语的跨领域分析》手稿的配套数据,包含分析所用的文本语料库和主题建模输出,覆盖媒体、商业、政策三个领域的文本数据及对应BERTopic分析结果。 文件详解 Media Articles.zip: ZIP格式压缩文件,包含拆分至单句的媒体文章CSV文件,附带标题、报纸等元数据。 Business...
-
儿童言语障碍文献主题建模数据集_LDA与BERTopic
2025年12月6日 30 201 33
数据集概述 本数据集及代码用于通过LDA和BERTopic方法分析儿童言语障碍研究论文的主题,数据来源于PubMed并经处理以支持主题建模,为儿童言语障碍领域的文献主题研究提供数据与方法支持。 文件详解 文件名称: speech_disorders_topic_modeling.zip 文件格式: ZIP压缩包(.zip) 文件内容:...



