数据集概述
本数据集是欧盟下一代互联网倡议(NGI Forward项目)的一部分,包含民族志学者对专题在线对话的编码结果及语义社交网络数据。数据以原始形式呈现,已伪匿名化,可用于进一步探索和复现研究,旨在为欧洲机构提供以人为中心的未来互联网政策建议。
文件详解
- annotations.csv(CSV格式)
- 字段映射:包含id、version、text、quote、uri、created_at、updated_at、post_id、creator_id、type、shape、units、geometry、src、ext、container、start、end、topic_id、post_creator_id、code_id等字段,记录对话的标注信息。
- posts.csv(CSV格式)
- 字段映射:包含post_number、post_id、created_at、topic_id、reply_count、reads、readers_count、incoming_link_count、quote_count、like_count、score、reply_to_post_id、source_username、target_username、text等字段,记录在线对话的帖子内容及互动数据。
- participants.csv(CSV格式)
- 字段映射:推测包含参与者的伪匿名信息及相关属性(具体字段未完全展示)。
- codes.csv(CSV格式)
- 字段映射:推测包含对话编码的分类及标准(具体字段未完全展示)。
- datapackage.json(JSON格式)
- 内容说明:数据打包的元数据文件,可能包含数据集描述、文件清单及数据导出文档链接。
数据来源
NGI Forward project(欧盟下一代互联网倡议项目)
适用场景
- 互联网政策研究:分析在线对话内容,为欧洲机构制定以人为中心的互联网政策提供数据支持。
- 语义社交网络分析:探索对话的语义关联及社交网络结构,研究信息传播与互动模式。
- 民族志编码复现:基于原始编码数据,复现或验证民族志学者的研究结果。
- 在线对话行为研究:分析参与者的互动行为(如回复、引用、点赞等)及对话主题分布。