数据集概述
本数据集围绕电池回收技术选择展开,包含基于知识图谱嵌入大语言模型的Battery-LLaMA模块、多目标优化框架相关数据,涵盖文献摘要、模型训练、优化结果等内容,为可持续电池回收技术研究提供支持。
文件详解
该数据集由多个目录和文件组成,具体说明如下:
- 数据文件目录(Data Utilized/):
- 摘要数据文件:如Battery_Recycle_Conditions_5900.xlsx、Battery_Recycling_Approaches_2200.xlsx等,存储电池回收相关文献摘要数据
- 多目标优化数据:Energy vs Profit vs Avg Recovery Rate Data for 84 LIB abstracts.xlsx,记录锂离子电池回收的能耗、收益及回收率数据
- NER任务数据:Results_withpredict.csv、Battery Material 70 sample NER data.xlsx,包含命名实体识别任务的样本与预测结果
- Q&A任务数据:150_QnA.csv、30 QnA (For final testing).xlsx,存储问答任务的问题与答案数据
- 精炼数据表:New Combined_Screened.xlsx、Combined_Numeric Value Screening.xlsx,为筛选后的结构化数据
- 图片与文档目录(Figures/):
- 模型相关:Battery-LLaMA.pdf、brkg1.pdf,展示Battery-LLaMA模型及电池回收知识图谱结构
- 优化结果:pareto_with_zoomed_subplot.pdf、MOO_Figure.pdf,呈现多目标优化的帕累托前沿等结果
- 训练曲线:Loss curve 1.png、Loss curve 2.png,记录模型训练过程中的损失变化
- 代码脚本目录(Python Scripts/):
- 数据处理脚本:Data_Extraction.ipynb、Abstract Splitting.ipynb,用于文献数据提取与摘要拆分
- 知识图谱构建脚本:Testing & Building the BR-KG through Neo4J.ipynb,实现电池回收知识图谱的构建
- 模型训练脚本:Battery_NER_finetuning.ipynb,用于命名实体识别模型的微调
- 问答系统脚本:Huggingface_Langchain_Q_A_with_GraphDB_using_LLM_Agent.ipynb,构建基于知识图谱的问答系统
- 多目标优化脚本:MOO.ipynb,实现电池回收技术的多目标优化分析
适用场景
- 电池回收技术研究:分析不同回收工艺的能耗、收益及回收率,优化技术选择
- 大语言模型应用:研究知识图谱嵌入对领域大语言模型性能的提升效果
- 多目标优化分析:探索可持续发展目标下的技术决策优化方法
- 自然语言处理应用:开展电池回收领域的命名实体识别、问答系统等任务研究