找到3个数据集

标签: 相似度得分

过滤结果
  • OMOP2OBO_Based_OMOP药物暴露成分与OBO本体映射数据_V1_0

    2026年1月19日 30 206 38

    数据集概述 本数据集为OMOP2OBO Drug Exposure Ingredient Mappings V1.0,通过OMOP2OBO算法生成,实现OMOP标准药物暴露成分概念(基于RxNorm)与ChEBI、NCBITaxon、PRO、VO等OBO Foundry本体的映射,含自动(基于TF-IDF嵌入、余弦相似度)及手动映射,支持语义互操作性。...
    packageimg
  • JailFact_Bench_LLM越狱攻击与幻觉分析基准数据集_SiMLA2025Workshop

    2026年1月5日 30 184 154

    数据集概述 本数据集是用于分析大语言模型(LLMs)越狱攻击与幻觉模式的基准数据集,包含语义对齐的越狱及事实性提示词,以及毒性变化、相似度得分、标注策略等元数据,支持LLM安全与事实一致性的评估研究。 文件详解 文件名称:README.md 文件格式:Markdown 字段映射介绍:包含数据集概述、开发背景、使用说明等文档内容...
    packageimg
  • 多语言新闻文章相似度数据集

    2025年12月9日 30 89 27

    数据集概述 该数据集是作者早期工作的扩展版本,包含2020年上半年的新闻文章对及其相似度标注。标注涵盖地理焦点、命名实体、时间相关性、叙事模式、整体内容、写作风格、语气及框架观点共八个维度,为多语言新闻文本的相似度分析提供结构化标注数据。 文件详解 文档文件: Codebook for text similarity annotations -...
    packageimg