找到76个数据集

标签: 评估数据集

过滤结果
  • 开放获取图书开放数据源评估数据集

    2026年2月15日 30 129 123

    数据集概述 本数据集包含论文《Open access books through open data sources: Assessing prevalence, providers, and preservation》中报告的原始采集数据,涵盖开放获取图书的数字对象标识符查询结果,以及出版物记录在各文献计量数据源和保存服务中的收录情况,共2个文件。...
    packageimg
  • 用户活动标签推理评估数据集

    2026年2月12日 30 138 6

    数据集概述 本数据集为评估语言模型从事件语义描述生成用户活动标签的能力而构建,包含30项活动(10项含2个事件、10项含3个事件、10项含4个事件),通过余弦相似度对比模型生成标签与人工标注标签的准确性,支持用户界面交互活动的标签推理研究。 文件详解 screenshots_&_soms.zip 文件格式:ZIP...
    packageimg
  • ClairCity_Based评估数据集

    2026年2月9日 30 64 2

    数据集概述 本数据集为ClairCity项目的评估数据集,包含元数据和数据条目,用于评估相关内容。数据集仅有一个文件,无目录结构,未划分训练/测试集、数据/标签集、原始/处理数据集,文件类型单一为.xlsx格式。 文件详解 文件名称:ClairCity evaluation data - MS.xlsx 文件格式:XLSX...
    packageimg
  • ChatTS_Based时间序列问答模型评估数据集

    2026年2月9日 30 189 167

    数据集概述 本数据集包含ChatTS模型的两个评估数据集A和B,每个样本包含timeseries、question、answer、attributes和ability_types字段。为降低评估成本,同一时间序列的多个问题被合并为单个question,通过编号区分,实际问题数量可能多于时间序列条目数量。部分归纳推理与对齐任务被合并到同一问题中。...
    packageimg
  • ShadowLink_Based_实体消歧评估数据集

    2026年2月9日 30 11 9

    数据集概述 本数据集是针对实体消歧评估的新型数据集,核心目标是分析消歧模型在"被遮蔽实体"(overshadowed entities)上的性能表现。数据集包含四个文件,均为JSON格式,无目录层级结构,未划分训练/测试集、数据/标签集或原始/处理数据集。 文件详解 Shadow.json 文件格式:JSON...
    packageimg
  • HTRD_Based_15世纪德语散文文本重用检测评估数据集

    2026年1月29日 30 189 134

    数据集概述 本数据集为15世纪德语散文文本重用检测(HTRD)的评估集,包含两篇采用TEI标准标注的文本:《科隆荆棘冠》和《科隆圣城编年史》。标注内容涵盖文本重用实例的分类与链接,文本为里普利安方言,存在拼写变体及手写文本识别(HTR)转录错误,适用于历史文本重用检测方法的评估。 文件详解...
    packageimg
  • Birt_HyLoc_Based_错误定位模型评估数据集

    2026年2月7日 30 46 29

    数据集概述 本数据集为错误定位模型HyLoc的评估数据,包含Birt项目相关文件。HyLoc结合深度神经网络(DNN)与信息检索技术rVSM,解决错误报告与源码间的词汇不匹配问题,提升错误定位准确率。数据集含两个文件,用于验证模型在实际项目中的性能表现。 文件详解 Birt.xlsx 文件格式:XLSX...
    packageimg
  • SecLLM_Based_网络安全问答数据集

    2026年2月1日 30 5 3

    数据集概述 本数据集聚焦网络安全领域,包含从StackExchange提取的5000余个问题及其人类高票回答,同时收录GPT-3.5-Turbo、GPT-4-4o等模型生成的回答,并附带ROUGE、SacreBLUE、BERTScore等相似度指标,用于评估大语言模型在网络安全场景下的问答质量,填补该领域研究空白。 文件详解...
    packageimg
  • 评估信息检索方法与知识推理工作流程_评估数据集

    2026年2月1日 30 59 1

    数据集概述 本数据集包含信息检索方法和知识推理工作流研究中使用的黄金标准数据集及评估结果,可用于验证信息检索系统性能与知识推理流程有效性,为相关研究提供标准化评估基准。 文件详解 文件名称:Evaluation.xlsx 文件格式:XLSX...
    packageimg
  • X_approach_Based本体填充方法评估数据集

    2026年1月31日 30 105 24

    数据集概述 本数据集包含11个文件,用于评估X-approach本体填充方法。数据分为输入、黄金标准和输出三类:输入含法语房产领域知识图谱及78条房产广告语料库;黄金标准为语料库填充后的标准知识图谱;输出含基于两种词形还原工具(Aker、TreeTagger)和四种方法(X-approach等)生成的8个知识图谱文件,可用于本体填充方法的性能对比分析。...
    packageimg
  • ORKG_Based开放研究知识图谱贡献相似度评估数据集

    2026年1月30日 30 27 25

    数据集概述 本数据集为开放研究知识图谱(ORKG)中的内容推荐系统评估而创建,基于ORKG的特征比较手动标注。包含同构(2-3个属性不同)和异构实例,以及有响应(推荐系统找到相似贡献)和无响应(未找到相似贡献)两类各50个实例,用于评估修改后的贡献相似度服务性能。 文件详解 文件名称:evaluation_set.json 文件格式:JSON...
    packageimg
  • DeepDRIM_Evaluation_Based_模型评估实验数据

    2026年1月26日 30 39 32

    数据集概述 本数据集用于评估深度学习模型DeepDRIM,支持复现相关手稿中的实验。数据集包含2个压缩文件,无目录结构,未区分训练/测试、数据/标签或原始/处理数据,所有文件均为压缩格式。 文件详解 文件名称:data_COVID-19.zip 文件格式:ZIP...
    packageimg
  • Gronings_Based_低资源语言口语术语检测特征提取方法评估数据集

    2026年1月21日 30 56 16

    数据集概述 本数据集用于评估低资源语言下基于示例查询的口语术语检测(QBE-STD)的特征提取方法,核心围绕Gronings语言相关的检测任务,通过单一压缩文件提供数据支持,可结合GitHub仓库的README获取详细信息。 文件详解 文件名称:gos-kdl.zip 文件格式:ZIP...
    packageimg
  • Mario_Tosem_Submission_方法名预测模型评估数据

    2026年1月26日 30 94 3

    数据集概述 本数据集是ACM TOSEM期刊评审中Mario论文的在线存储库,包含研究使用的开源数据集链接、项目源代码文件、实验结果说明及用户研究数据,用于支持方法名预测模型的实证研究与性能评估。 文件详解 数据集链接 实证数据集:Liu et al. 收集的实证数据集(提供外部链接) 评估数据集:Alon et al....
    packageimg
  • 数据1shot_2020_Based_单样本新类别物体分类评估数据集

    2026年1月23日 30 134 100

    数据集概述 本数据集为单样本新类别物体分类评估数据集,包含数千条众包人类对新物体的响应刺激与数据,用于测试机器学习模型与人类在单样本泛化能力上的差异,可作为各类类别学习模型的测试基准。 文件详解 文件名称:1shot_2020.zip 文件格式:ZIP...
    packageimg
  • Reproduction_Package_多语言跨语言剽窃检测评估复现数据

    2026年1月21日 30 173 27

    数据集概述 本数据集为学士学位论文《Multi-Language and Cross-Language Plagiarism Detection》的复现包,包含论文评估所用全部数据,可确保论文结果的持续复现。内容涵盖修改版JPlag工具、评估用数据集及自动化运行脚本,支持多语言和跨语言剽窃检测的技术验证与结果复现。 文件详解...
    packageimg
  • LODsyndesisIE_Evaluation_实体识别评估集与结果数据

    2026年1月21日 30 134 111

    数据集概述 本数据集包含LODsyndesisIE实体识别任务的评估资源,涵盖SimpleWiki、MSNBC、AQUAINT三个评估集的10篇测试文本(平均每篇83.2词、含15.8个实体),以及不同实体识别工具的效果与效率评估结果,用于验证实体识别及LODsyndesis内容富集能力。 文件详解 评估文本文件(TXT格式)...
    packageimg
  • SimIMA_Based_Simulink智能建模助手初始评估数据v1_0

    2026年1月21日 30 155 97

    数据集概述 本数据集是Simulink智能建模助手(SimIMA)的初始评估数据,对应Bhisma Adhikari于2021年在迈阿密大学的学位论文研究。数据包含SimGestion和SimXample两个模块的评估相关文件,以压缩包形式提供,用于支持SimIMA工具的开发与性能验证。 文件详解 文件名称:SimIMA-evaluation-...
    packageimg
  • LetsAskAIAboutTheirPrograms_AI程序理解与评估数据集

    2026年1月19日 30 204 92

    数据集概述 本数据集包含OpenAI GPT-3.5生成的60个Python小程序(对应6个入门编程任务,每个任务10个功能正确的变体)、399个针对这些程序的理解问题、GPT-3.5和GPT-4对问题的798个回答,以及研究人员对回答正确性的标注和错误类型编码,同时包含数据处理与分析脚本。 文件详解...
    packageimg
  • LODVec_Evaluation_Datasets_and_Experiments

    2026年1月18日 30 137 93

    数据集概述 本数据集包含用于评估LODVec系统的输入数据集,以及机器学习任务的输入数据,包括分类预测类、回归评级,和电影与篮球运动员的顶级相关实体。数据集来源于德国曼海姆大学,支持LODVec系统的性能验证与实验分析。 文件详解 machinelearningpredictions.zip 文件格式:ZIP...
    packageimg