Reddit_Based_实体链接数据集_多标注文本语义分析完整数据

数据集概述

该数据集是基于社交媒体平台Reddit创建的实体链接数据集,包含六百一十九条帖子及一千二百四十三条对应评论,由三名人工标注者对文本分组进行标注,记录了提及-实体对及不同标注者间的一致性结果,含黄金、白银、青铜三种标注类型,总计一万一千一百零三条标注数据。

文件详解

  • 文件名称: reddit_el.zip
  • 文件格式: ZIP压缩包(.zip)
  • 文件内容: 压缩包内包含数据集核心文件,具体结构及信息需参考随附的README文件(注:未提供文件预览内容)

适用场景

  • 自然语言处理研究: 用于实体链接模型的训练与评估
  • 标注质量分析: 探究多标注者一致性对实体标注结果的影响
  • 社交媒体文本挖掘: 研究社交媒体内容中实体提及的特征与规律
  • 语义理解应用: 支持社交平台文本的语义解析与知识图谱构建
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.33 MiB
最后更新 2025年12月10日
创建于 2025年12月10日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。