大型语言模型生成的维基百科多选题数据集-yalickj

大型语言模型生成的维基百科多选题数据集-yalickj 数据来源:互联网公开数据 标签:多选题,维基百科,人工智能,机器学习,自然语言处理,考试,教育,测评,生成式AI 数据概述: 本数据集包含由大型语言模型(LLMs, Large Language Models)生成的维基百科主题多选题及其选项。数据集中,每个样本包含一个基于维基百科内容的题目,以及多个备选答案,其中仅有一个正确答案。由于生成过程的复杂性,以及LLMs的固有局限性,数据集中的部分样本可能存在瑕疵,例如:答案错误、题目或选项表述模糊、存在多个正确答案或没有正确答案等问题。数据集的创建旨在探索LLMs在生成教育类内容方面的能力,并为后续的质量评估和改进提供基础。 数据用途概述: 该数据集可用于多种研究和应用场景。例如: 1. LLMs能力评估:用于评估不同LLMs生成多选题的质量,包括准确性、多样性、难度等。 2. 多选题生成技术研究:用于研究改进LLMs生成多选题的技术,例如提示工程、模型微调等。 3. 教育领域应用探索:用于探索LLMs在教育领域的应用潜力,例如自动生成练习题、辅助教师备课等。 4. 数据集质量分析:用于分析数据集的质量,识别其中的错误样本,并进行修正。 5. 模型训练:可以用于训练新的LLM,或者微调现有的LLM,提升其生成多选题的能力。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 0.06 MiB
最后更新 2025年4月23日
创建于 2025年4月23日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。