-
大型语言模型LLM科学考试RLHF训练数据集
大型语言模型LLM科学考试RLHF训练数据集 数据来源:互联网公开数据 标签:LLM, 科学考试, RLHF, 奖励模型训练, 强化学习, 自然语言处理, 机器学习 数据概述: 本数据集是使用Llama-2-13b模型生成的,专门用于奖励模型(RM, Reward Model)训练,进而应用于强化学习与人类反馈(RLHF, Reinforcement... -
Kaggle问答社区常见问题解答数据集-用户提问与LLM智能回复
Kaggle问答社区常见问题解答数据集-用户提问与LLM智能回复 数据来源:互联网公开数据 标签:Kaggle,问答,FAQ,常见问题,LLM,大语言模型,自然语言处理,数据科学,社区,知识库 数据概述:... -
ChatGPT安卓应用用户评价数据集-每日更新
ChatGPT安卓应用用户评价数据集-每日更新 数据来源:互联网公开数据 标签:ChatGPT,安卓应用,用户评价,评论分析,评分,用户体验,自然语言处理,App Store 数据概述: 本数据集包含每日更新的ChatGPT安卓应用用户评价和评分。数据集涵盖了用户评论的多个关键属性,提供了关于用户体验和反馈随时间变化的深入分析。 字段解释:... -
GPT-4o20问游戏对战数据-LLM问答竞赛数据集
GPT-4o20问游戏对战数据-LLM问答竞赛数据集 数据来源:互联网公开数据 标签:大型语言模型,GPT-4o,20问游戏,LLM,问答,机器学习,自然语言处理,游戏数据,问答竞赛,数据集 数据概述:... -
亚马逊乐器客户评论数据集
亚马逊乐器客户评论数据集 数据来源:互联网公开数据 标签:亚马逊,客户评论,乐器,情感分析,自然语言处理,消费者反馈,产品质量 数据概述: 本数据集包含在亚马逊平台上销售的乐器的客户评论。每个评论包括评论标题、评论正文以及客户的整体评分等信息。该数据集为感兴趣于情感分析和自然语言处理的研究者提供了宝贵的资源。 数据用途概述:... -
WinoBias性别偏见解决Winograd模式数据集
WinoBias性别偏见解决Winograd模式数据集 数据来源:互联网公开数据 标签:性别偏见,共指解析,Winograd模式,自然语言处理,计算语言学,文本分析 数据概述:... -
疫苗接种倾向分析数据集
疫苗接种倾向分析数据集 数据来源:互联网公开数据 标签:疫苗接种,公众态度,社交媒体分析,COVID-19,健康政策,自然语言处理,情感分析 数据概述:... -
印度尼日利亚英文短信垃圾信息数据集
印度尼日利亚英文短信垃圾信息数据集 数据来源:互联网公开数据 标签:短信数据,垃圾信息识别,文本分析,自然语言处理,用户行为,数据隐私 数据概述:... -
摩洛哥方言-英语词汇对照数据集
摩洛哥方言-英语词汇对照数据集 数据来源:互联网公开数据 标签:摩洛哥方言,英语,自然语言处理,NLP,词汇对照,方言研究,语言学 数据概述:... -
英语词汇综合列表数据集
英语词汇综合列表数据集 数据来源:互联网公开数据 标签:英语词汇,自然语言处理,NLP,语言学,词汇库 数据概述: 本数据集包含超过416,000个独特的英语单词,涵盖了广泛的主题和领域,是一个全面的英语词汇列表。该数据集适用于多种自然语言处理任务、语言学研究和其他需要大量英语词汇的应用场景。 数据用途概述:... -
福尔摩斯的矛盾增强数据集1963-2021
福尔摩斯的矛盾增强数据集1963-2021 数据来源:互联网公开数据 标签:自然语言处理,数据增强,矛盾检测,机器翻译,同义词替换,测试集增强,文本分析 数据概述:... -
LG电子员工评价数据集
LG电子员工评价数据集 数据来源:互联网公开数据 标签:LG电子,员工评价,工作环境,职场体验,数据分析,情感分析,自然语言处理 数据概述: LG电子员工评价数据集汇集了来自Ambition Box平台上员工对LG电子的评价和意见,Ambition... -
问答平台问题点赞数预测数据集
问答平台问题点赞数预测数据集 数据来源:互联网公开数据 标签:问答平台,用户行为分析,点赞预测,机器学习,自然语言处理,声誉,用户互动,数据挖掘 数据概述:... -
-
英语语法错误纠正常用数据集
英语语法错误纠正常用数据集 数据来源:互联网公开数据 标签:语法错误,英语学习,自然语言处理,语法纠正,机器学习,文本分析 数据概述: 本数据集是JFLEG(JHU FLuency-Extended... -
Eminem专辑YouTube评论垃圾邮件分类数据集
Eminem专辑YouTube评论垃圾邮件分类数据集 数据来源:互联网公开数据 标签:Eminem, YouTube, 评论, 垃圾邮件, 自然语言处理, 机器学习, 文本分类, 社交媒体分析 数据概述: 本数据集由Ezhil... -
-
Anthropic公司Claude模型生成的1000篇论文数据集-说服性写作练习-多主题-时间跨度未知
Anthropic公司Claude模型生成的1000篇论文数据集-说服性写作练习-多主题-时间跨度未知 数据来源:互联网公开数据 标签:人工智能,自然语言处理,文本生成,写作,Claude模型,说服性写作,论文,Anthropic 数据概述: 本数据集包含了由Anthropic公司开发的Claude-... -
-
英国英语语音识别数据集1963-2021
英国英语语音识别数据集1963-2021 数据来源:互联网公开数据 标签:英国英语,语音识别,自然语言处理,对话系统,语言理解,音频数据,文本转录,演讲者信息,多样话题 数据概述:...