数据集概述
本数据集是论文“Exploring ChatGPT-4 for Transforming Taxonomic Data into OWL”的支持数据,包含使用ChatGPT-4、Gemini、DeepSeek等大模型将GBIF骨干分类数据转换为OWL本体的实验数据,涉及提示词、日志、训练文件及生成的本体文件等,共17个文件。
文件详解
- 本体文件(.owl):共8个,如Sus.owl、Tilapia.owl、PiaractusMesopotamicus.owl等,为实验生成的物种分类OWL本体文件
- 提示词文件(.txt):共4个,包括DeepSeek_prompt.txt、Gemini_prompt.txt、GPTlog032024.txt、GPTtraining.txt,记录模型输入的提示词及实验日志
- 数据文件(.xml):共4个,如apto.xml、Animalia.xml、plantae.xml、ApisMellifera.xml,为分类数据相关的XML格式文件
- 代码文件(.py):共1个,即PlantSpeciesList.py,为实验相关的Python代码文件
数据来源
论文“Exploring ChatGPT-4 for Transforming Taxonomic Data into OWL: Lessons Learned and Implications for Ontology Development”
适用场景
- 生物分类本体开发研究:用于分析大模型转换分类数据为OWL本体的效果与方法
- 自然语言处理在本体工程中的应用:研究大模型提示词设计对本体生成质量的影响
- 生物信息学工具评估:对比不同大模型(ChatGPT-4、Gemini、DeepSeek)在分类数据本体转换任务中的性能
- 分类数据标准化研究:探索GBIF分类数据向语义网格式(OWL)转换的路径与挑战