Webis_Revenue_10_德国新闻营收声明标注数据集

数据集概述

该数据集包含2003至2009年德国29家新闻网站的1128篇新闻文章,由领域专家手动标注了2075条企业或市场营收声明,每条声明包含7个核心属性,为研究新闻文本中的营收信息提取提供标注数据支持。

文件详解

  • 压缩数据文件:
  • revenuecorpus_annotated.tar.gz:.gz格式压缩文件,包含标注后的新闻文章数据集,每条营收声明标注有Forecast/Declaration、Organization/Market等7个属性
  • 说明文档:
  • RevenueCorpus_Documentation.pdf:PDF格式文档,介绍数据集构建方法、标注规则及属性定义等背景信息

适用场景

  • 自然语言处理研究:用于训练和评估新闻文本中营收信息抽取的模型
  • 金融信息提取:探索自动化识别企业营收声明、趋势及相关实体的方法
  • 新闻文本语义分析:研究经济领域新闻中结构化信息的标注与提取技术
  • 商业智能分析:为从新闻数据中挖掘企业营收动态提供标注数据支持
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 6.3 MiB
最后更新 2025年12月11日
创建于 2025年12月11日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。