Reddit_Based_平台工人在线讨论语料库_研究用

数据集概述

本数据集包含从Reddit平台的/r/youtubers和/r/uberdrivers子版块采集的两个讨论语料库,用于研究平台工人的话语表达。数据集通过抓取各子版块排名前一千的讨论帖及每个帖子的五条评论构建,共六千条内容,旨在直接探究平台工人的审议状态、声音表达及实用主义视角下的探究与持续学习特征。

文件详解

  • 文件名称:youtube-full.json
  • 文件格式:JSON
  • 字段映射介绍:包含从Reddit子版块/r/youtubers采集的讨论数据,具体字段未明确说明,但推测包含帖子标题、正文、评论内容、发布时间、用户信息等讨论相关基础信息。
  • 文件名称:uber-full.json
  • 文件格式:JSON
  • 字段映射介绍:包含从Reddit子版块/r/uberdrivers采集的讨论数据,具体字段未明确说明,但推测包含帖子标题、正文、评论内容、发布时间、用户信息等讨论相关基础信息。

适用场景

  • 平台经济劳动者话语分析: 研究YouTuber与Uber司机在在线社区中的讨论内容、主题分布及表达特征。
  • 平台工人审议状态研究: 分析平台工人在讨论中体现的探究深度、观点碰撞及共识形成过程。
  • 实用主义学习行为探究: 基于讨论内容识别平台工人在工作实践中体现的持续学习模式与问题解决策略。
  • 数字劳动平台治理参考: 为理解平台工人需求、优化平台管理政策提供实证话语数据支持。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 3.27 MiB
最后更新 2026年1月30日
创建于 2026年1月30日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。