GPT-4o20问游戏对战数据-LLM问答竞赛数据集

GPT-4o20问游戏对战数据-LLM问答竞赛数据集 数据来源:互联网公开数据 标签:大型语言模型,GPT-4o,20问游戏,LLM,问答,机器学习,自然语言处理,游戏数据,问答竞赛,数据集 数据概述: 本数据集包含了由GPT-4o模型生成的“20问”游戏对战数据。该数据是通过让GPT-4o的“猜谜者”代理与GPT-4o的“答题者”代理进行游戏而产生的。数据集遵循LLM 20问Kaggle竞赛的游戏结构。其中,猜谜者最多有20轮机会来猜测只有答题者知道的秘密关键词。每轮游戏包含以下步骤:

  • 猜谜者提问(类型为“ask”):猜谜者提出一个问题。
  • 答题者回答(类型为“answer”):答题者以二元回答“no”(否)或“yes”(是)进行回复。(任何其他回答都是非法的。)
  • 猜谜者猜测(类型为“guess”):猜谜者猜测秘密关键词。

数据集的生成目标是复制GPT-4o在成功游戏中的行为,用于训练更小型的开源LLM,例如“Meta-Llama-3.1-8B-Instruct”。

数据用途概述: 该数据集主要用于训练和评估LLM的问答能力,特别是用于模仿GPT-4o在20问游戏中的表现。具体应用场景包括:

  • 模型训练:用于训练更小型的LLM,使其能够像GPT-4o一样进行有效的提问和猜测。
  • 行为克隆:通过训练,使小模型学习GPT-4o在游戏中的策略和提问风格。
  • 模型评估:评估不同LLM在20问游戏中的表现,包括提问质量、猜测准确性等。
  • 竞赛准备:为LLM问答竞赛提供训练数据和评估标准。
  • 研究:用于研究LLM在推理、知识获取和策略制定方面的能力。
packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 1.98 MiB
最后更新 2025年4月15日
创建于 2025年4月15日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。