数据集

GPT-4o20问游戏对战数据-LLM问答竞赛数据集

GPT-4o20问游戏对战数据-LLM问答竞赛数据集数据来源：互联网公开数据标签：大型语言模型,GPT-4o,20问游戏,LLM,问答,机器学习,自然语言处理,游戏数据,问答竞赛,数据集数据概述：本数据集包含了由GPT-4o模型生成的“20问”游戏对战数据。该数据是通过让GPT-4o的“猜谜者”代理与GPT-4o的“答题者”代理进行游戏而产生的。数据集遵循LLM 20问Kaggle竞赛的游戏结构。其中，猜谜者最多有20轮机会来猜测只有答题者知道的秘密关键词。每轮游戏包含以下步骤：

猜谜者提问（类型为“ask”）：猜谜者提出一个问题。
答题者回答（类型为“answer”）：答题者以二元回答“no”（否）或“yes”（是）进行回复。（任何其他回答都是非法的。）
猜谜者猜测（类型为“guess”）：猜谜者猜测秘密关键词。

数据集的生成目标是复制GPT-4o在成功游戏中的行为，用于训练更小型的开源LLM，例如“Meta-Llama-3.1-8B-Instruct”。

数据用途概述：该数据集主要用于训练和评估LLM的问答能力，特别是用于模仿GPT-4o在20问游戏中的表现。具体应用场景包括：

模型训练：用于训练更小型的LLM，使其能够像GPT-4o一样进行有效的提问和猜测。
行为克隆：通过训练，使小模型学习GPT-4o在游戏中的策略和提问风格。
模型评估：评估不同LLM在20问游戏中的表现，包括提问质量、猜测准确性等。
竞赛准备：为LLM问答竞赛提供训练数据和评估标准。
研究：用于研究LLM在推理、知识获取和策略制定方面的能力。

数据与资源

GPT-4o20问游戏对战数据-LLM问答竞赛数据集.zipZIP
1.98 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	1.98 MiB
最后更新	2025年4月15日
创建于	2025年4月15日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

GPT-4o20问游戏对战数据-LLM问答竞赛数据集

数据与资源

附加信息

注册成功！