-
评估信息检索方法与知识推理工作流程_评估数据集
2026年2月1日 30 109 14
数据集概述 本数据集包含信息检索方法和知识推理工作流研究中使用的黄金标准数据集及评估结果,可用于验证信息检索系统性能与知识推理流程有效性,为相关研究提供标准化评估基准。 文件详解 文件名称:Evaluation.xlsx 文件格式:XLSX...
-
南非语言嵌入评估数据集_Simlex_和_WordSim
2026年1月30日 30 16 0
数据集概述 本数据集包含针对南非语言(塞茨瓦纳语、塞佩迪语)的Simlex和WordSim评估数据,通过人工标注的单词对相似度评分,用于衡量语义相关性。单词对由英文手动翻译而来,可用于计算模型向量余弦相似度与人类评分的相关性,评估语言模型性能。数据集共含4个文件。 文件详解 文件名称:SimLex-999-orig - Sepedi.xlsx...
-
DBpedia_Based_知识库问答问题与答案类型标注数据集
2026年1月29日 30 175 88
数据集概述 本数据集包含37279个基于DBpedia的知识库问答问题,以及对应的答案类别和类型列表。问题来源于QALD 1-9、LC-QuAD 1.0和SimpleDBpediaQA的训练与测试数据集,答案类型体系采用自ISWC 2020的SMART-task挑战标准,为知识库问答任务的模型训练与评估提供标注数据支持。 文件详解...
-
ExBAN_Corpus_Based贝叶斯网络自然语言解释标注语料库
2026年1月26日 30 154 76
数据集概述 本数据集为ExBAN语料库,包含众包参与者针对贝叶斯网络(BN)图形表示生成的自然语言解释,以及这些解释的清晰度和信息量人工评分。语料库用于研究自然语言生成(NLG)自动评估指标与人工评分的相关性,支持可解释AI领域的解释质量评估研究,总计包含1个压缩文件。 文件详解 文件名称:ExBAN.zip 文件格式:ZIP...
-
TPDL_2020_Based_古籍OCR噪声命名实体识别评估基准数据
2026年1月26日 30 37 28
数据集概述 本数据集为古籍命名实体识别(NER)评估基准数据,基于CoNLL-02(西班牙语、荷兰语)和CoNLL-03(英语)NER语料库,通过模拟OCR噪声生成多语言含噪文本,包含原始文本转图像、添加扫描噪声、Tesseract OCR提取及文本对齐等处理环节,用于评估OCR质量对NER任务的影响。 文件详解 文件名称:ner_dataset-...
-
ARAFA_Generated_Based_阿拉伯语大规模事实核查数据集
2026年1月21日 30 70 49
数据集概述 本数据集是面向阿拉伯语自然语言处理的大规模事实核查数据集ARAFA,通过大语言模型自动化框架构建,包含181,976条标注为支持、反驳或信息不足的主张-证据对,可用于阿拉伯语自动事实核查模型训练与评估。 文件详解 文件名称:ARAFA.json 文件格式:JSON...
-
数据20Newsgroup_Based_机器学习解释评估人工标注词权重数据
2026年1月21日 30 133 96
数据集概述 本数据集是论文“Quantitative Evaluation of Machine Learning Explanations: A Human-Grounded...
-
Webis_Clickbait_Based_2016年Twitter推文标注数据集
2026年1月15日 30 25 14
数据集概述 本数据集为Webis Clickbait Corpus 2016,包含2014年从转发量前20的新闻出版商处采样的2992条Twitter推文,由三位独立标注者手动标注是否为clickbait,其中767条被多数标注者判定为clickbait。多数投票结果可作为构建clickbait检测技术的基准真值,是该领域首个数据集。 文件详解...
-
低剂量计算机断层扫描感知图像质量评估挑战赛数据集2023
2025年12月22日 30 18 2
数据集概述 该数据集为MICCAI 2023挑战赛专用,聚焦低剂量计算机断层扫描(CT)图像的感知质量评估。包含含复杂伪影(稀疏视图条纹、噪声)的CT图像,用于验证无参考图像质量评估(NR-IQA)模型与放射科医生主观评分的相关性,解决现有指标临床适用性不足的问题。 文件详解 文件名称: LDCTIQAG2023_train.zip 文件格式:...
-
JavaSMT框架扩展与Bitwuzla求解器评估基准数据集
2025年12月22日 30 129 64
数据集概述 该数据集是论文《Extending the Framework JavaSMT with the SMT Solver Bitwuzla and Evaluation using CPAchecker》的基准文件,包含评估JavaSMT框架扩展及Bitwuzla求解器性能的相关数据文件。 文件详解...
-
Agarwal联合文库56k序列模型评估数据集2025
2025年12月20日 30 68 27
数据集概述 本数据集为Agarwal等人2025年发布的联合文库56k序列模型评估容器,用于通过GAME API评估预测模型性能。包含56982条顺式调控元件序列及正负对照序列,覆盖3种细胞类型的测量数据,支持表达预测和细胞类型特异性评估。 文件详解 该数据集包含2个文件,具体说明如下: - 主要文件: - agarwal_joint_56k.sif:...
-
LLM生成代码片段可读性对比数据集
2025年12月19日 30 43 26
数据集概述 本数据集聚焦LLM生成代码片段的可读性研究,包含ChatGPT、DeepSeek、Gemini三款模型生成代码的对比分析相关文件,以压缩包形式提供,为探究不同大语言模型代码生成质量差异提供数据支持。 文件详解 文件名称:Replication Package.zip 文件格式:ZIP(压缩包格式)...
-
古希腊语到英语翻译对齐标注指南与黄金标准数据集
2025年12月15日 30 67 5
数据集概述 该数据集包含古希腊语文本与英语翻译对齐的标注指南及黄金标准,标注覆盖荷马史诗、雅典散文、柏拉图对话等文本,经测试标注者间一致性达百分之八十及以上,可用于翻译对齐的执行、评估及自动化模型训练。 文件详解 文件名称: eng.txt 文件格式: TXT (.txt) 内容说明:...
-
CI_CD流水线演进与重构研究数据集及脚本
2025年12月13日 30 23 11
数据集概述 本数据集为CI/CD流水线演进与重构的定性定量研究配套数据,包含初始项目集、候选提交列表、人工验证样本等结构化数据文件,以及分析脚本和分类文档,支持复现研究中关于CI/CD基础设施使用及重构的分析结果。 文件详解 该数据集包含多个文件,具体说明如下: - 数据文件 (.csv格式,共7个): -...
-
数据质量评估基准数据集DataQualityEstimationBenchmarkDataset-bulivington
2025年5月11日 30 120 81
数据质量评估基准数据集DataQualityEstimationBenchmarkDataset-bulivington 数据来源:互联网公开数据 标签:数据质量,评估基准,数据清洗,数据科学,机器学习,数据管理,质量控制,数据分析 数据概述:该数据集包含来自多个数据集的数据质量评估指标,用于衡量和比较不同数据集的质量特征。主要特征如下:...



