火星目标百科全书_月球与行星科学会议标注摘要数据集2015_2016

数据集概述

本数据集包含2015年和2016年月球与行星科学会议(LPSC)发表的117篇摘要的标注文本数据,通过Apache Tika工具提取PDF文本,并以brat标注工具格式提供实体与关系注释,支持文本挖掘与信息提取研究。

文件详解

  • 压缩文件:lpsc-annotated.zip(ZIP格式),包含以下目录和文件:
  • lpsc15/目录:62篇2015年LPSC摘要,每篇含.txt(文本文件)和.ann(brat标注格式的实体与关系注释文件)
  • lpsc16/目录:55篇2016年LPSC摘要,每篇含.txt(文本文件)和.ann(brat标注格式的实体与关系注释文件)
  • 辅助文件:.conf配置文件,用于brat工具的颜色高亮与快捷键设置

数据来源

Zenodo(DOI:10.5281/zenodo.1048419)

适用场景

  • 天体物理学研究:提取月球与行星科学文献中的岩石和土壤成分信息
  • 自然语言处理:训练与测试实体识别、关系抽取等文本挖掘模型
  • 文献计量分析:分析LPSC会议摘要中的研究主题与知识关联
  • 学术数据共享:为行星科学领域的文本数据标注提供标准化范例
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.54 MiB
最后更新 2025年12月11日
创建于 2025年12月11日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。