找到417个数据集

标签: 主题建模

过滤结果
  • 科学教育研究主题建模数据集

    2025年12月10日   

    数据集概述 本数据集包含Wiley期刊《Science Education》(前身为《General Science Quarterly》)近百年发表文章的文本数据,经清洗处理后用于自然语言处理分析,特别是潜在狄利克雷分配(LDA)主题建模。数据集包含5577篇1922年后发表的文章文本及相关元数据,并提供Jupyter...
    packageimg
  • 早期长期亲子分离影响的质性数据集_分离重聚华裔美国儿童心理健康研究

    2025年12月10日   

    数据集概述 该数据集为探讨早期长期亲子分离对分离重聚华裔美国儿童心理健康影响的质性研究数据,包含24组亲子对的半结构化访谈内容及编码,聚焦心理健康影响、风险/保护因素与服务需求,由美国国家少数族裔健康与健康差异研究所资助。 文件详解 访谈脚本文件(共50个,.docx格式):...
    packageimg
  • N词块主题建模工具数据集

    2025年12月10日   

    数据集概述 本数据集是使用主题建模工具(Topic Modeling Tool),通过N词块(N-word Chunks)设置生成的主题建模结果数据,包含不同主题数量的主题元数据、文档-主题关联、主题-词汇关联文件及工具设置文件,共二十七份文件。 文件详解 主题建模结果文件: 主题元数据文件:如4-topic-NwordChunks-topics-...
    packageimg
  • 讽刺作为理解极权现实的手段文献

    2025年12月10日   

    数据集概述 本数据集包含一篇以“讽刺作为理解极权现实的手段”为主题的文献,以PDF格式呈现,为研究讽刺与极权现实的关系提供资料支持。 文件详解 文件名称:Gafurova D.T.pdf 文件格式:PDF(.pdf) 文件内容:围绕“讽刺作为理解极权现实的手段”主题的文献资料 适用场景 文学研究:分析讽刺手法在揭示极权现实中的作用...
    packageimg
  • 卢卡馄饨公司三维扫描数据集

    2025年12月10日   

    数据集概述 该数据集包含对美国旧金山卢卡馄饨公司(Lucca Ravioli Company)的三维扫描及预览图片数据,记录了这家历史悠久的家族企业的外观,为三维模型研究或文化记录提供基础数据。 文件详解...
    packageimg
  • Kompas_com新闻编辑部AI应用访谈记录

    2025年12月9日   

    数据集概述 本数据集包含对印尼Kompas.com三位核心人员的半结构化访谈记录,受访者涉及新闻管理编辑、内容营销经理及区域编辑,聚焦AI在新闻编辑流程、决策及伦理考量中的应用体验与反思,为研究印尼新闻业数字化转型提供定性数据。 文件详解 文件名称:Transkrip Interview.docx.pdf 文件格式:PDF...
    packageimg
  • 中国当代文化社会议题研究主题列表2025

    2025年12月9日   

    数据集概述 本数据集是一份主题列表,收录2012年及以后中国当代文学、电影、戏剧和视觉艺术领域的作品名称与标题,围绕政党-社会关系、理想社会构想等五个社会议题展开分类分析,为研究中国当代文化社会议题提供结构化参考。 文件详解 该数据集包含两个文件,具体说明如下: - 文件名称: Topic list for WP2 Culture_2025.03.22...
    packageimg
  • 学士学位论文数据集_DT133G_L3

    2025年12月9日   

    数据集概述 本数据集为学士学位论文相关的数据集,包含一个压缩文件,未提供具体内容描述,可用于获取与学士学位论文研究相关的原始或整理数据。 文件详解 文件名称: job_listings-zip.zip 文件格式: ZIP (.zip) 内容说明: 该压缩文件为数据集的唯一文件,具体内容需解压后查看,未提供内部文件结构及字段信息。 适用场景 教育学研究:...
    packageimg
  • 数学与哲学相关两篇短文

    2025年12月9日   

    数据集概述 该数据集包含两篇关于数学与哲学的短文,分别介绍数学哲学中的形式主义观点(认为数学和逻辑陈述是符号串按规则操作的结果)和柏拉图主义观点(数学断言的真值依赖于时空外的柏拉图实体)。 文件详解 文件名称:...
    packageimg
  • 基拉_布尔列耶夫作品中的奇幻世界

    2025年12月9日   

    数据集概述 该数据集包含一份PDF文档,主题围绕基拉·布尔列耶夫作品中的奇幻世界展开,具体内容未提供详细描述,文件类型单一,以文档形式呈现。 文件详解 文件名称: Парпиева Нафиса Садиковна.pdf 文件格式: PDF 内容说明: 文档主题为基拉·布尔列耶夫作品中的奇幻世界,具体字段信息未提供 适用场景 文学研究:...
    packageimg
  • 土耳其新冠疫情推特数据库样本

    2025年12月9日   

    数据集概述 该数据集为土耳其新冠疫情相关推特数据库样本,包含疫情爆发前后各一个月的土耳其语推文ID,按新冠、经济、政治、宗教、虚假信息、国际关系等主题分类,为研究疫情期间社交媒体内容提供数据支持。 文件详解 文件名称: id.zip 文件格式: ZIP (.zip) 内容说明:...
    packageimg
  • 加利福尼亚州北部帕西菲卡海滩艺术水管结构数据集

    2025年12月9日   

    数据集概述 本数据集聚焦于美国加利福尼亚州北部帕西菲卡海滩上的大型工业水管艺术结构,该结构融合了当地艺术元素,并以金色冥想犬雕像为顶部装饰,包含实物影像与三维模型文件。 文件详解...
    packageimg
  • iPRES2015_Based_数字保存会议协作笔记分析完整数据

    2025年12月9日   

    数据集概述 该数据集是2015年11月在美国查珀尔希尔举办的第十二届国际数字保存会议(iPRES2015)的扩展内容,包含会议各环节的协作笔记,于2019年4月15日捕获为1.0版本,为研究数字保存领域的会议内容提供支持。 文件详解 该数据集包含三十七个PDF格式文件,按会议环节分类如下: - 通用信息类: - 含ipres2015_general_3...
    packageimg
  • 美国政治精英性质研究_特权与公共责任

    2025年12月8日   

    数据集概述 本数据集包含一份关于美国政治精英的研究文档,聚焦其特权与公共责任的性质,为理解政治精英群体的角色定位提供资料支持。 文件详解 文件名称:Muhammadsolih Abdullaev.pdf 文件格式:PDF (.pdf) 文件内容:以美国为案例,探讨政治精英的特权属性与公共责任的关联研究文档 适用场景...
    packageimg
  • 量子技术叙事跨领域分析数据集

    2025年12月8日   

    数据集概述 本数据集为《量子技术叙事:媒体、商业与政策话语的跨领域分析》手稿的配套数据,包含分析所用的文本语料库和主题建模输出,覆盖媒体、商业、政策三个领域的文本数据及对应BERTopic分析结果。 文件详解 Media Articles.zip: ZIP格式压缩文件,包含拆分至单句的媒体文章CSV文件,附带标题、报纸等元数据。 Business...
    packageimg
  • 移民作为统治性_他者_移民与民族主义的社会政治动态研究访谈记录

    2025年12月8日   

    数据集概述 本数据集包含一项关于"移民作为统治性'他者'"研究的访谈记录,围绕移民与民族主义的社会政治动态展开,为相关主题的质性分析提供原始访谈文本支持。 文件详解 文件名称: interview transcipts.pdf 文件格式: PDF (.pdf) 内容说明:...
    packageimg
  • RDA数据管理组织模式调查数据集2021

    2025年12月8日   

    数据集概述 该数据集包含2021年10月至11月RDA数据管理专业化兴趣组开展的调查的匿名清理数据,共136份受访者回答,以及对开放文本问题的主题文本分析结果,支持研究数据管理领域的专业化研究。 文件详解 文件名称:final_survey_dataset.csv 文件格式:CSV...
    packageimg
  • 信息科学领域期刊主题覆盖图谱数据集

    2025年12月8日   

    数据集概述 该数据集包含信息科学领域期刊的主题覆盖图谱,通过自然语言处理技术提取术语并应用信息科学叙词表生成,共33个HTML格式文件,为研究期刊主题分布提供数据支持。 文件详解 主题覆盖图谱文件(共33个):...
    packageimg
  • 撤回文章定性定量引用分析方法论数据集

    2025年12月8日   

    数据集概述 本数据集是《撤回文章的定性定量引用分析:案例研究》方法论应用的成果,包含数据收集阶段的引用实体特征与文本数据集,以及基于引用摘要和上下文的主题建模结果,为撤回文章引用行为研究提供支持。 文件详解 数据集包含一个压缩文件及解压后的子文件,具体说明如下: - 主压缩文件: - method_data.zip:...
    packageimg
  • 加西亚_洛尔迦文学主题选择中的性别影响研究数据集

    2025年12月8日   

    数据集概述 该数据集围绕加西亚·洛尔迦文学研究中性别与主题选择的关系展开,分析Web of Science和Scopus数据库中作者使用的关键词,构建认知地图识别六大研究领域,为探索性别对研究主题选择及知识生成类型的影响提供支持。 文件详解 文件名称: Ruiz-Baena_fp_issi2025.pdf 文件格式: PDF 内容说明:...
    packageimg