cBioPortal_Chroma_Based_2024_cBioPortal内容向量数据库完整数据

数据集概述

该数据集包含2024年7月收集的cBioPortal文档、Google Groups及研究文章的向量数据库,用于LangChain大语言模型聊天机器人应用,需配置环境变量和API密钥运行示例脚本。

文件详解

  • 文件名称: cbioportal_chroma_zenodo.zip
  • 文件格式: ZIP(.zip)
  • 内容说明: 压缩包内包含用于LangChain LLM聊天机器人应用的向量数据库,涉及cBioPortal文档、Google Groups内容及研究文章数据;需配合环境变量(AZURE_OPENAI_ENDPOINT、API_KEY、API_VERSION)和示例脚本chroma_vectorstore_example.py使用

适用场景

  • LangChain大语言模型聊天机器人开发:构建基于cBioPortal内容的问答系统
  • 生物信息学文档检索研究:探索向量数据库在学术文档检索中的应用
  • 自然语言处理应用测试:验证AZURE OpenAI API在特定领域文本嵌入与检索的效果
  • 生物医学知识管理:辅助生物医学研究者快速获取cBioPortal相关信息
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 572.49 MiB
最后更新 2025年12月5日
创建于 2025年12月5日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。