多样饮食分类与标注烹饪食谱数据集-2023-nazmussakibrupol
数据来源:互联网公开数据
标签:烹饪食谱,食品分类,自然语言处理,营养分析,食谱生成,机器学习,数据标注
数据概述:
本数据集收录了由“Assorted, Archetypal, and Annotated Two Million (3A2M)”项目整理的两百万条烹饪食谱记录。这些食谱涵盖了五类关键信息:食谱名称、烹饪步骤、食材、类别及其对应的数字标签。数据集中的烹饪步骤和食材信息直接来源于RecipeNLG数据集,共计300,000条食谱由三位食品专家手动分类至九个预设类别,其余190万条食谱则通过主动学习及查询委员会方法自动分类。
数据集中的九个类别为:烘焙、饮品、非素食、蔬菜、快餐、谷物、主菜、配菜、融合菜。
数据用途概述:
该数据集适用于多种场景,包括但不限于营养分析、医学营养咨询、食谱生成及自然语言处理的研究。具体来说,医疗营养师可以利用本数据集为患者推荐多样化的餐食;若能估计每道食谱的分量,则有助于分析不同食物的摄入情况及营养成分;此外,该数据集还适用于训练食谱生成模型、食品分类任务等自然语言处理应用场景。数据集的详细分类和标注使其成为上述领域研究的重要资源。