数据集概述
本数据集包含由SVM模型生成的IPC分类号与研究领域的映射模型及对照表,基于专利标题、关键词和摘要构建。数据集共6个文件,包含1个对照表文件和5个机器学习模型文件,用于实现IPC分类号到研究领域的自动化映射。
文件详解
- 数据文件
- 文件名称:SVM_RA_IPC.xlsx
- 文件格式:XLSX
- 字段映射介绍:IPC分类号与研究领域的对照表,包含IPC分类号、对应的研究领域标签等映射关系字段
- 模型文件
- 文件名称:best_model_multi_label_decision_tree.joblib
- 文件格式:JOBLIB
- 字段映射介绍:多标签决策树模型文件,用于IPC到研究领域的映射预测
- 文件名称:best_model_multi_label_mnb.joblib
- 文件格式:JOBLIB
- 字段映射介绍:多标签朴素贝叶斯模型文件,用于IPC到研究领域的映射预测
- 文件名称:best_model_multi_label_random_forest.joblib
- 文件格式:JOBLIB
- 字段映射介绍:多标签随机森林模型文件,用于IPC到研究领域的映射预测
- 文件名称:best_model_multi_label_clf.joblib
- 文件格式:JOBLIB
- 字段映射介绍:多标签分类模型文件,用于IPC到研究领域的映射预测
- 文件名称:best_model_multi_label_svm.joblib
- 文件格式:JOBLIB
- 字段映射介绍:多标签支持向量机模型文件,用于IPC到研究领域的映射预测
适用场景
- 专利分类研究:用于分析IPC分类号与研究领域的对应关系,辅助专利的研究领域归类
- 专利数据分析:为专利数据的自动化处理提供IPC到研究领域的映射工具
- 机器学习模型应用:基于提供的多标签分类模型,实现IPC分类号到研究领域的批量映射
- 知识产权研究:支持知识产权领域中专利技术领域分布的统计与分析