"英文标题:Global Intellectual Property Services Field Patent Retrieval Algorithm Parameters and Performance Validation Dataset
数据集概述
记录知识产权服务领域专利检索与分析系统核心算法的特征参数及实验验证结果,涵盖文本相似度计算、技术主题分类、专利引用网络分析等关键算法模块的参数配置与性能指标。
数据按算法类型与实验场景组织,覆盖专利检索全流程的核心技术环节,支持多算法间的性能对比与参数优化。颗粒度精确至单算法、单参数、单实验批次层级,遵循知识产权服务领域的算法验证规范,字段定义清晰且可复现。
该数据集是专利检索与分析系统优化升级的核心支撑资源。算法性能直接影响专利信息检索的准确性、召回率与响应速度,依托该数据集可系统验证算法参数对专利检索效果的影响,为知识产权服务机构提升系统性能、科研团队迭代算法模型、相关企业选型专利检索工具提供数据基础。
字段详情
数据集包含以下核心字段:
algorithm_module:算法模块,标识专利检索系统中的具体功能模块,如文本相似度匹配、技术主题聚类
feature_parameter:特征参数,指算法运行时的可配置参数,如向量维度、匹配阈值
precision_rate:精确率,单位百分比,指检索结果中相关专利的占比
recall_rate:召回率,单位百分比,指所有相关专利中被检索出的占比
response_time_ms:响应时间,单位毫秒,指算法处理单批次检索请求的耗时
experimental_scenario:实验场景,标识算法验证的具体应用场景,如全文检索、分类检索
适用场景
- 知识产权服务机构优化专利检索系统算法参数,提升检索结果的精准度与效率
- 科研团队开展专利检索算法的性能验证与模型迭代研究
- 企业专利管理人员评估不同检索算法的适用性,为工具选型提供依据
- 行业监管部门制定专利检索系统的性能评估标准与规范"