菜谱配料实体识别数据集RecipeIngredientEntityRecognitionDataset-dhruvansh26

菜谱配料实体识别数据集RecipeIngredientEntityRecognitionDataset-dhruvansh26

数据来源:互联网公开数据

标签:菜谱, 配料, 实体识别, 自然语言处理, 文本标注, 命名实体识别, 数据集, 烹饪

数据概述: 该数据集包含菜谱配料信息,记录了菜谱中配料的文本描述及其对应的实体标注。主要特征如下: 时间跨度:数据未明确标注时间,视作静态语料数据集使用。 地理范围:数据未限定特定地理区域,适用于全球范围内的烹饪食谱分析。 数据维度:包括“ingredients”(配料文本)和“ingredients_entities”(配料实体标注)两个字段。其中,ingredients_entities字段以JSON格式标注了配料文本中每个实体的起始位置、类型和实体名称。 数据格式:CSV格式,文件名为TASTEset(1).csv,便于文本处理和实体识别模型的训练与评估。 该数据集适合用于配料实体识别任务,例如识别配料名称、数量、单位等信息。

数据用途概述: 该数据集具有广泛的应用潜力,特别适用于以下场景: 研究与分析:适用于自然语言处理、文本挖掘等领域的学术研究,例如配料信息提取、菜谱知识图谱构建等。 行业应用:为烹饪应用、食谱推荐系统提供数据支持,例如智能食谱生成、食材推荐、营养分析等。 决策支持:支持烹饪行业的产品开发和市场分析,例如菜谱优化、食材搭配推荐等。 教育和培训:作为自然语言处理、实体识别等课程的实训数据,用于学生训练模型、了解实体识别任务。 此数据集特别适合用于探索菜谱配料信息的结构化提取,帮助用户构建智能食谱系统、提升食谱信息处理的自动化水平。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 0.14 MiB
最后更新 2025年4月29日
创建于 2025年4月29日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。