找到16个数据集

标签: 主题挖掘

过滤结果
  • SRL_Based_系统综述文献文章数据库

    2026年2月2日 30 34 27

    数据集概述 本数据集为系统综述(SRL)所用文章的数据库,包含系统综述研究中涉及的文献文章信息。数据集共包含1个文件,未进行训练测试、数据标签或原始处理数据的拆分,文件类型单一,便于集中查阅和使用。 文件详解 文件名称:Base de datos_SRL-Estrategias de visibilidad.xlsx 文件格式:XLSX...
    packageimg
  • Scopus_Based_农业相关生命周期评估研究文献集2023

    2026年1月28日 30 94 62

    数据集概述 本数据集为Scopus数据库中农业相关生命周期评估(LCA)研究的文献集合,通过特定检索式筛选出英文期刊文章(排除贸易期刊),经相关性筛查后最终包含259篇文献,是农业领域LCA研究的文献参考资源。 文件详解 文件名称:Kalachevska et al_Bibliographic collection.docx 文件格式:DOCX...
    packageimg
  • CS_Based_计算机科学项目描述学习维度识别研究数据_2022

    2026年1月27日 30 203 46

    数据集概述 本数据集基于CS Track数据库的94个英文项目描述,通过定性内容分析识别其中的学习维度。采用Phillips等人2018年模型的修改版作为编码框架,由两名研究者独立编码为8个主类别、21个子类别,提取高频关键词,揭示不同学习维度的体现程度差异。 文件详解 Dataset_Analysis Intended Educational...
    packageimg
  • Interviews_transcriptions_情感研究访谈转录完整数据集

    2026年1月19日 30 24 14

    数据集概述 本数据集为情感研究相关访谈的完整转录集合,包含十七份访谈文档。数据用于评估情感研究内容、识别原始研究未覆盖的兴趣领域,以及为测试怀旧与负面情感考古环境中情感触发理论的数字考古游戏提供支持。转录经手写与多次审核,但可能因录音连接问题或语言理解困难存在语法及拼写错误,包含受访者真实姓名。 文件详解 访谈转录文件 文件名称:包括Dr. Ian...
    packageimg
  • BioStars_API_Based_生物信息学论坛问答数据20220327

    2026年1月20日 30 131 110

    数据集概述 本数据集为BioStars问答论坛API输出内容,涵盖截至帖子ID(UID)9557161的论坛数据,包含生物信息学、计算基因组学及生物数据分析相关的问答内容。数据集由Zenodo平台发布,遵循BioStars内容许可协议,不含9463943至494831号ID的内容,总计包含一个JSON文件。 文件详解...
    packageimg
  • PTA_Patristische_Textarchiv教父文献档案TEI模式数据

    2026年1月15日 30 137 74

    数据集概述 本数据集包含教父文献档案(Patristische Textarchiv,PTA)使用的TEI模式及其相关文档,用于规范教父文献的数字化编码与存储。数据集以压缩包形式提供,包含一套标准化的文本编码框架,适用于教父文献的结构化处理与长期保存。 文件详解 文件名称:PatristicTextArchive/Schema-v.4.0.zip...
    packageimg
  • Bridging_Oceans_Based_南美生物海洋走廊区域一体化文献数据集

    2026年1月15日 30 5 2

    数据集概述 本数据集聚焦南美生物海洋走廊与区域一体化主题,包含文献元数据Excel文件及Iramuteq生成的文本分类TXT文件。核心为59条文献的详细元数据,涵盖出版类型、作者、摘要等信息,辅以5个分类文本文件,支撑该领域的文献分析与主题挖掘。 文件详解 Excel元数据文件 文件名称:dataset_SLR.xlsx 文件格式:XLSX...
    packageimg
  • Dataset_Key_Phrases_Article_Titles_创新_理论建构_中国特色数据集

    2026年1月4日 30 82 13

    数据集概述 本数据集围绕“创新”“理论建构”“中国特色”三个关键词,收录相关的关键词与文章标题信息,以结构化表格形式呈现,可用于学术研究中的文本分析、主题挖掘等场景。 文件详解 文件名称:Dataset of key phrases and article titles - '创新' (Innovation), '理论建构' (Theoretical...
    packageimg
  • Luxembourgish_word_embedding_Based_RTL_lu用户评论训练模型数据

    2026年1月2日 30 183 84

    数据集概述 本数据集是基于卢森堡媒体平台RTL.lu的用户评论训练的卢森堡语词嵌入模型,包含2008年12月至2018年12月期间约54.4万条卢森堡语文本数据,为卢森堡语自然语言处理任务提供语义向量支持。 文件详解 文件名称:Luxembourgish word embedding_RTL user comments.zip 文件格式:ZIP...
    packageimg
  • 数据可视化焦点小组分析数据集

    2025年12月21日 30 91 71

    数据集概述 该数据集包含两组关于数据可视化的焦点小组分析资料,涵盖原始转录文本及分析矩阵文件,为研究数据可视化相关讨论提供结构化数据支持。 文件详解 分析矩阵文件: frequency_matrix_v2.xlsx:Excel格式文件,包含焦点小组内容的频率分析矩阵,横轴标注分类体系(元类别、类别、子类别),通过颜色区分层级,支持后续轴心编码。...
    packageimg
  • amai_项目第四批公民科学家提交创意清单

    2025年12月9日 30 70 69

    数据集概述 本数据集收录了amai!项目第四批中公民科学家提交的创意清单,创意按气候、健康、出行和工作等主题进行分类聚合,所有内容仅提供荷兰语版本。 文件详解 文件名称: ClustersPosters.pdf 文件格式: PDF (.pdf) 内容说明: 包含按气候、健康、出行和工作主题分类的公民科学家提交创意清单,内容仅为荷兰语。 适用场景...
    packageimg
  • 自闭症治疗复兴临床从业者证据数据集

    2025年12月5日 30 190 105

    数据集概述 该数据集包含针对自闭症治疗的临床从业者调查数据,涵盖美国新泽西州及其他地区的行为分析师(BCBA)、国际发展与学习理事会(ICDL)认证治疗师的调查结果,涉及问卷回复、文本数据及分析文件,为自闭症治疗研究提供实证支持。 文件详解 该数据集由多类型文件组成,具体说明如下: - 文档类文件(共30个): -...
    packageimg
  • Res_Militaris_Based_科学欺诈研究文档档案完整数据

    2025年12月9日 30 12 5

    数据集概述 本数据集为2023年5月27日发布的Res Militaris PDF档案,包含一个压缩文件,可能与科学欺诈相关实体的研究背景资料有关,具体内容需解压后查看。 文件详解 文件名称: res_militaris_archive_230527.zip 文件格式: ZIP (.zip) 内容说明:...
    packageimg
  • 新闻组文章分类数据集1990-2000

    2025年4月15日 30 30 0

    新闻组文章分类数据集1990-2000 数据来源:互联网公开数据 标签:新闻组,文本分类,文本预处理,文本聚类,主题挖掘,主题分类,自然语言处理 数据概述:...
    packageimg
  • Reddit占星学讨论社区帖子与评论数据集

    2025年4月15日 30 101 80

    Reddit占星学讨论社区帖子与评论数据集 数据来源:互联网公开数据 标签:占星学,Reddit,社交媒体,文本分析,情感分析,主题挖掘,社区,讨论,帖子,评论 数据概述: 本数据集收录了来自Reddit占星学(r/Astrology)子版块的帖子和评论数据,数据未经过滤。 数据通过Python Reddit API...
    packageimg
  • Reddit宝可梦社区帖子主题与用户互动分析数据集

    2025年4月14日 30 196 69

    Reddit宝可梦社区帖子主题与用户互动分析数据集 数据来源:互联网公开数据 标签:宝可梦,Reddit,社交媒体,用户互动,帖子分析,主题挖掘,社区,游戏,流行趋势 数据概述:...
    packageimg