数据集

大型语言模型生成的维基百科多选题数据集-yalickj

大型语言模型生成的维基百科多选题数据集-yalickj 数据来源：互联网公开数据标签：多选题,维基百科,人工智能,机器学习,自然语言处理,考试,教育,测评,生成式AI 数据概述：本数据集包含由大型语言模型（LLMs, Large Language Models）生成的维基百科主题多选题及其选项。数据集中，每个样本包含一个基于维基百科内容的题目，以及多个备选答案，其中仅有一个正确答案。由于生成过程的复杂性，以及LLMs的固有局限性，数据集中的部分样本可能存在瑕疵，例如：答案错误、题目或选项表述模糊、存在多个正确答案或没有正确答案等问题。数据集的创建旨在探索LLMs在生成教育类内容方面的能力，并为后续的质量评估和改进提供基础。数据用途概述：该数据集可用于多种研究和应用场景。例如： 1. LLMs能力评估：用于评估不同LLMs生成多选题的质量，包括准确性、多样性、难度等。 2. 多选题生成技术研究：用于研究改进LLMs生成多选题的技术，例如提示工程、模型微调等。 3. 教育领域应用探索：用于探索LLMs在教育领域的应用潜力，例如自动生成练习题、辅助教师备课等。 4. 数据集质量分析：用于分析数据集的质量，识别其中的错误样本，并进行修正。 5. 模型训练：可以用于训练新的LLM，或者微调现有的LLM，提升其生成多选题的能力。

数据与资源

versions_20250410105709.zipZIP
0.06 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	0.06 MiB
最后更新	2025年4月23日
创建于	2025年4月23日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。