人类行为偏好数据集

人类行为偏好数据集 数据来源:互联网公开数据
标签:行为偏好, AI伦理, 社会动态, 人类反馈, 实验研究

数据概述:
本数据集由Anthropic Labs研究团队通过Human-in-the-Loop方法收集,包含来自众包工作者对不同提示的回答,旨在探索“ helpfulness(帮助性)”与“ harmlessness(无害性)”之间的细微差别。数据集分为训练集和测试集,每条数据记录包含两个字段:“ chosen”(被选择的选项)和“ rejected”(被拒绝的选项)。这些字段反映了参与者在面对特定提示时的选择偏好。值得注意的是,某些记录中可能只有一个字段有值,另一个字段为空。

数据用途概述:
该数据集适用于研究人类在面对“帮助性”与“无害性”问题时的行为偏好,以及不同群体(如性别、年龄、文化背景等)之间的差异。研究者可利用此数据集分析人类对行为偏好的认知模式,完善AI模型的设计与优化,使其更符合人类的价值观与伦理标准。此外,数据集还为理解社会动态与人机交互提供了重要的研究素材。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 75.31 MiB
最后更新 2025年4月20日
创建于 2025年4月20日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。