找到14个数据集

标签: 文档检索

过滤结果
  • heureCLÉA_Source_项目源文档数据1_0

    2026年2月7日 30 69 66

    数据集概述 本数据集为heureCLÉA项目的源文档数据,版本为1.0。数据以压缩包形式存储,包含项目相关的源文档内容,未区分训练/测试、数据/标签或原始/处理数据类型,无可用的自述文件或内容预览。 文件详解 文件名称:heureclea/sourcedocuments-1.0.zip 文件格式:ZIP...
    packageimg
  • 设备技术材料数据集2023

    2025年12月9日 30 48 43

    数据集概述 本数据集包含一份关于设备技术材料的文档,聚焦设备相关技术与材料领域的内容,以单一PDF文件形式呈现,为该领域的信息查询和研究提供基础资料支持。 文件详解 文件名称: ETM-17.05.2023.pdf 文件格式: PDF (.pdf) 内容说明: 该文件为文档类文件,包含与设备技术材料主题相关的内容,具体字段或详细内容未提供。 适用场景...
    packageimg
  • ENwikIR1k_维基百科检索开发数据完整集合

    2025年12月7日 30 160 156

    数据集概述 该数据集是通过wikIR工具获取的开发数据集,包含一个压缩文件,未进行训练/测试、数据/标签或原始/处理的拆分,为相关研究提供基础数据支持。 文件详解 文件名称: wikIR1k.zip 文件格式: ZIP (.zip) 内容说明: 压缩包内包含通过wikIR工具获取的开发数据集内容,具体字段及结构未提供预览信息 适用场景...
    packageimg
  • cBioPortal_Chroma_Based_2024_cBioPortal内容向量数据库完整数据

    2025年12月5日 30 45 27

    数据集概述 该数据集包含2024年7月收集的cBioPortal文档、Google Groups及研究文章的向量数据库,用于LangChain大语言模型聊天机器人应用,需配置环境变量和API密钥运行示例脚本。 文件详解 文件名称: cbioportal_chroma_zenodo.zip 文件格式: ZIP(.zip) 内容说明:...
    packageimg
  • 放线菌分离株脂肪分解试验中菌落生长与透明圈形成对比图

    2025年11月29日 30 205 173

    数据集概述 本数据集为单份PDF文档,展示了放线菌分离株在脂肪分解试验中的菌落生长情况与透明圈形成的对比图,以三丁酸甘油酯培养基检测脂肪酶活性,反映脂肪酶水解脂质的能力。 文件详解 数据集包含一个PDF格式的图片文件,具体如下: - 文件名称: Fig. 1. Comparison of colony growth and formation of...
    packageimg
  • 实验室规模膜蒸馏系统文件与手册

    2025年11月27日 30 153 12

    数据集概述 该数据集包含实验室规模膜蒸馏系统的相关文件与手册,涵盖系统操作说明及第三方设备使用指南,为膜蒸馏实验操作提供参考资料支持。 文件详解 主系统手册: 文件名称:Manual Destilación con Membranas.pdf 文件格式:PDF 内容说明:膜蒸馏系统的核心操作手册,提供系统使用的基础指导 第三方设备手册(位于Third...
    packageimg
  • BM25文档检索与信息提取数据集BM25DocumentRetrievalandInformationExtractionDataset-dinhnhattruong

    2025年5月30日 30 125 0

    BM25文档检索与信息提取数据集BM25DocumentRetrievalandInformationExtractionDataset-dinhnhattruong 数据来源:互联网公开数据 标签:文档检索,信息提取,数据集,信息检索,自然语言处理,机器学习,文本挖掘,数据科学 数据概述:...
    packageimg
  • 法律文档检索数据集BKALegalDocumentRetrievalCorpus-ictunivers

    2025年5月29日 30 98 71

    法律文档检索数据集BKALegalDocumentRetrievalCorpus-ictunivers 数据来源:互联网公开数据 标签:法律,文档检索,数据集,信息检索,自然语言处理,文本分类,法律科技,机器学习 数据概述: 该数据集包含来自德国联邦刑事警察局(BKA)的法律文档检索数据,记录了法律文档的检索和分类信息。主要特征如下:...
    packageimg
  • 文档检索数据集Retrieval-DocumentDataset-hlv305

    2025年5月28日 30 151 70

    文档检索数据集Retrieval-DocumentDataset-hlv305 数据来源:互联网公开数据 标签:文档检索,数据集,信息检索,自然语言处理,机器学习,文本分析,人工智能,搜索引擎 数据概述: 该数据集包含来自多个来源的文档数据,记录了文档内容及其相关检索信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。...
    packageimg
  • BKAI法律文档检索数据集BKAILegalDocumentRetrievalDataset-littlekai25

    2025年5月13日 30 128 25

    BKAI法律文档检索数据集BKAILegalDocumentRetrievalDataset-littlekai25 数据来源:互联网公开数据 标签:法律,文档检索,数据集,自然语言处理,文本分类,机器学习,信息检索,人工智能 数据概述: 该数据集由BKAI(BKAV人工智能研究院)提供,专注于法律文档的检索任务。主要特征如下:...
    packageimg
  • 局部敏感哈希LSH文档数据集-massivedatamining

    2025年4月25日 30 142 46

    局部敏感哈希LSH文档数据集-massivedatamining 数据来源:互联网公开数据 标签:文本分析,局部敏感哈希,数据集,文档检索,信息检索,机器学习,自然语言处理,相似性搜索 数据概述:该数据集包含了用于研究和评估局部敏感哈希(LSH)算法的文档集合。主要特征如下: 时间跨度:数据记录的时间范围不限,取决于文档的创建时间。...
    packageimg
  • 微软大规模机器阅读理解文档检索评分数据集MSMARCOQueryDocScoreDataset-tnhan1806

    2025年4月23日 30 126 83

    微软大规模机器阅读理解文档检索评分数据集MSMARCOQueryDocScoreDataset-tnhan1806 数据来源:互联网公开数据 标签:机器阅读理解,文档检索,数据集,自然语言处理,信息检索,深度学习,文本匹配,问答系统 数据概述: 该数据集由微软发布,旨在促进机器阅读理解和文档检索领域的研究。数据集的核心是查询-...
    packageimg
  • 非监督学习自然语言处理数据集

    2025年4月15日 30 164 27

    非监督学习自然语言处理数据集 数据来源:互联网公开数据 标签:自然语言处理,非监督学习,问答系统,TF-IDF,文档检索 数据概述: 本数据集用于非监督学习中的问答系统训练。数据集中的每一行代表一个文档,适用于通过向量模型和TF-IDF方法检索用户查询的答案。该数据集包含大量的文本信息,为构建有效的问答系统提供了丰富的训练素材。 数据用途概述:...
    packageimg
  • 单主题RAG评估数据集

    2025年4月14日 30 150 82

    单主题RAG评估数据集 数据来源:互联网公开数据 标签:RAG,自然语言处理,文本查询,评估数据集,机器学习,文档检索,问答系统 数据概述: 本数据集旨在评估单主题文档中RAG(Retrieval-Augmented...
    packageimg