数据集概述
本数据集包含OpenCare项目的一级和二级数据,一级数据为在线对话(帖子和评论),二级数据为基于一级数据的民族志工作成果(注释和代码或标签)。数据集提供5个文件,支持通过API访问(需申请密钥),可用于研究OpenCare项目的语义社交网络特征。
文件详解
- 数据文件包定义文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:数据集的元数据定义文件,通常包含数据集描述、文件清单、字段说明等信息
- 注释数据文件
- 文件名称:annotations.csv
- 文件格式:CSV
- 字段映射介绍:包含id、version、text、quote、uri、created_at、updated_at、post_id、creator_id、type、shape、units、geometry、src、ext、container、start、end、topic_id、post_creator_id、code_id等字段,记录注释相关信息
- 代码数据文件
- 文件名称:codes.csv
- 文件格式:CSV
- 字段映射介绍:包含id、description、creator_id、created_at、updated_at、ancestry、annotations_count、name、name_with_path、names等字段,记录代码相关信息
- 帖子数据文件
- 文件名称:posts.csv
- 文件格式:CSV
- 字段映射介绍:记录OpenCare项目的帖子数据,具体字段未完全展示
- 参与者数据文件
- 文件名称:participants.csv
- 文件格式:CSV
- 字段映射介绍:记录OpenCare项目的参与者数据,具体字段未完全展示
数据来源
OpenCare项目
适用场景
- 语义社交网络分析:研究OpenCare项目中在线对话的语义特征和社交网络结构
- 民族志数据研究:分析基于在线对话的注释和代码数据,探索用户互动模式
- 社交互动模式挖掘:通过帖子和评论数据,挖掘用户参与OpenCare项目的互动规律
- 项目参与者行为分析:利用参与者数据,研究用户在项目中的参与行为和特征