BO4CO_Stream_流处理系统不确定性感知配置优化性能测量数据集

数据集概述

本数据集包含流处理系统配置优化的性能测量数据,支持论文研究结果。数据集为压缩包格式,内含10个CSV文件,记录3种流基准应用在5个云集群上的吞吐量、延迟等性能指标,覆盖全因子配置组合,是流处理系统配置优化研究的关键实验数据。

文件详解

  • 文件名称:bo4co_dataset.zip
  • 文件格式:ZIP
  • 字段映射介绍:压缩包内含10个CSV格式数据集,每个文件按“benchmark_application-dimensions-cluster_name”命名(如“wc-6d-c1”),每行对应一种配置设置,最后两列记录10分钟内的平均吞吐量和延迟性能指标,覆盖全因子配置组合的穷尽测量数据。

数据来源

论文“An Uncertainty-Aware Approach to Optimal Configuration of Stream Processing Systems”

适用场景

  • 流处理系统配置优化研究: 用于分析不同配置参数对系统吞吐量、延迟性能的影响,验证不确定性感知优化方法的有效性。
  • 云集群性能评估: 对比5种云集群环境下流处理应用的性能表现,为集群选型提供数据支持。
  • 基准应用性能分析: 研究WordCount等3种流基准应用在多维度配置下的性能特征与瓶颈。
  • 系统性能建模: 基于全因子配置的测量数据,构建流处理系统性能预测模型。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.13 MiB
最后更新 2026年1月22日
创建于 2026年1月22日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。