数据集概述
本数据集为提交至IEEE Access的语义搜索文献综述与研究议程相关数据,包含二十四个文件,涵盖文献引用数据、LDA模型文件、文献库数据等内容,涉及ScienceDirect、Web of Science、IEEE等来源的文献信息及语义分析模型相关文件,为语义搜索领域的研究提供文献支撑与分析基础。
文件详解
- 文献引用数据文件
- 文件名称:ScienceDirect_citations_1-1532.xlsx(含多个分段文件,如ScienceDirect_citations_1-100.xlsx等)、WebofScience1-1977.xls(含WebofScience1-1000.xls、WebofScience1001-1977.xls)、IEEE_Export.xlsx
- 文件格式:.xlsx、.xls
- 字段映射介绍:包含文献引用相关信息,具体字段可参考各数据库导出格式(如标题、作者、发表信息等)
- 文献库数据文件
- 文件名称:AISeLibrary.csv
- 文件格式:.csv
- 字段映射介绍:包含Title(标题)、article type(文章类型)、Authors(作者)、book_title(书籍标题)、publication date(发表日期)、access date(访问日期)、url(链接)、summary(摘要)等字段
- LDA模型相关文件
- 文件名称:23-04-05_lda.model、23-04-05_lda.model.expElogbeta.npy、23-04-05_lda.model.state、23-04-05_lda.model.id2word
- 文件格式:.model、.npy、.state、.id2word
- 字段映射介绍:包含LDA模型文件、模型参数文件、模型状态文件及词映射文件等语义分析相关文件
数据来源
提交至IEEE Access的论文“Asking the Machine: A Literature Review and Research Agenda on Semantic Search”
适用场景
- 语义搜索领域文献分析: 利用文献引用数据及文献库数据,分析语义搜索领域的研究现状与发展趋势
- 文献计量学研究: 通过各数据库文献数据,开展语义搜索领域的文献计量学分析
- 主题模型应用研究: 基于LDA模型文件,探究语义搜索领域的主题分布与演化
- 文献综述支撑: 为语义搜索相关文献综述提供数据支持,辅助研究议程制定