菜谱配料实体识别数据集RecipeIngredientEntityRecognitionDataset-dhruvansh26
数据来源:互联网公开数据
标签:菜谱, 配料, 实体识别, 自然语言处理, 文本标注, 命名实体识别, 数据集, 烹饪
数据概述:
该数据集包含菜谱配料信息,记录了菜谱中配料的文本描述及其对应的实体标注。主要特征如下:
时间跨度:数据未明确标注时间,视作静态语料数据集使用。
地理范围:数据未限定特定地理区域,适用于全球范围内的烹饪食谱分析。
数据维度:包括“ingredients”(配料文本)和“ingredients_entities”(配料实体标注)两个字段。其中,ingredients_entities字段以JSON格式标注了配料文本中每个实体的起始位置、类型和实体名称。
数据格式:CSV格式,文件名为TASTEset(1).csv,便于文本处理和实体识别模型的训练与评估。
该数据集适合用于配料实体识别任务,例如识别配料名称、数量、单位等信息。
数据用途概述:
该数据集具有广泛的应用潜力,特别适用于以下场景:
研究与分析:适用于自然语言处理、文本挖掘等领域的学术研究,例如配料信息提取、菜谱知识图谱构建等。
行业应用:为烹饪应用、食谱推荐系统提供数据支持,例如智能食谱生成、食材推荐、营养分析等。
决策支持:支持烹饪行业的产品开发和市场分析,例如菜谱优化、食材搭配推荐等。
教育和培训:作为自然语言处理、实体识别等课程的实训数据,用于学生训练模型、了解实体识别任务。
此数据集特别适合用于探索菜谱配料信息的结构化提取,帮助用户构建智能食谱系统、提升食谱信息处理的自动化水平。