找到293个数据集

标签: Reddit

过滤结果
  • 社交媒体药品情感分析数据集

    2026年3月2日 30 186 174

    社交媒体药品情感分析数据集_Social_Media_Drug_Sentiment_Analysis_Dataset 数据来源:互联网公开数据 标签:情感分析, 药品, Reddit, 社交媒体, 文本挖掘, 自然语言处理, 情感极性, 主观性 数据概述:...
    packageimg
  • 社交媒体舆情分析Reddit评论数据集

    2026年2月26日 30 75 29

    社交媒体舆情分析Reddit评论数据集_Social_Media_Sentiment_Analysis_Reddit_Comments 数据来源:互联网公开数据 标签:社交媒体, 舆情分析, 情感分析, 文本挖掘, Reddit, 自然语言处理, 数据标注, 用户评论 数据概述:...
    packageimg
  • C_SSRS_Based_Reddit用户自杀风险标注数据集

    2026年2月8日 30 66 4

    数据集概述 本数据集包含Reddit平台r/SuicideWatch等心理健康相关子版块用户的自杀风险评估数据。通过哥伦比亚自杀严重程度评定量表(C-SSRS),由领域专家对448名用户标注为支持性、自杀意念、自杀行为、自杀尝试四类标签,标注者间一致性达0.76。数据集含7个文件,覆盖匿名用户帖子及标注信息,为社交媒体自杀风险分析提供支撑。 文件详解...
    packageimg
  • Reddit_r_TheRedPill社区讨论数据

    2026年1月31日 30 35 7

    数据集概述 本数据集包含Reddit平台r/TheRedPill社区的相关内容,共2个文件,均为JSON格式,无目录结构。数据未划分训练/测试集、数据/标签集或原始/处理集,无README或内容预览,可用于分析该社区的讨论内容和用户互动情况。 文件详解 文件名称:trp_comments.json 文件格式:JSON 字段映射介绍:推测包含Reddit...
    packageimg
  • EMSE_Based功能安全特征分类定位研究复制包2025

    2026年1月29日 30 7 0

    数据集概述 本数据集为发表于《Empirical Software Engineering》2025年的论文《A Taxonomy of Functional Security Features and How They Can Be...
    packageimg
  • Reddit_Comments_Dataset_文本风格迁移任务评论数据集

    2026年1月21日 30 114 68

    数据集概述 本数据集为文本风格迁移任务准备,包含Reddit评论及其正式语言翻译。数据来自20个Subreddits,通过GPT-2筛选高困惑度评论进行翻译,分为原始评论、带标签翻译及带风格示例的翻译文件,共5个文件,支持风格迁移模型训练与评估。 文件详解 reddit_comments.csv 文件格式:CSV...
    packageimg
  • Trawling_for_Trolling_Based_社交媒体骚扰类型标注数据集

    2026年1月18日 30 18 9

    数据集概述 本数据集包含12490行社交媒体内容样本,按仇恨言论、贬损内容、网络骚扰、亵渎内容和正常内容五类标注。数据主要来源于Twitter、Reddit和Wikipedia讨论页,无帖子元数据,可用于网络骚扰类型识别相关研究。 文件详解 文件名称:Dataset_to_upload.xlsx 文件格式:XLSX...
    packageimg
  • Geospatiality_Study_Based_英文文本地理位置与主题关系研究数据集

    2026年1月13日 30 128 14

    数据集概述 本数据集包含复现Geospatiality研究所需的代码与数据,核心研究英文文本中主题对地理位置信息出现频率的影响。数据覆盖Twitter、Reddit等六个来源,含匿名化文本数据压缩包、R分析脚本及主题分类表,支持研究结果的验证与可视化。 文件详解 数据压缩包(.zip)...
    packageimg
  • Reddit_MentalHealthSubreddits_2017年心理健康社区帖子评论数据

    2026年1月12日 30 151 10

    数据集概述 本数据集包含2017年Reddit平台四个高活跃度心理健康子版块(Depression、SuicideWatch、Anxiety、Bipolar)的所有帖子、评论及元数据,以压缩包形式提供,可用于研究在线心理健康社区的用户内容与互动特征。 文件详解 压缩包文件 文件名称:MentalHealthSubreddits2017.zip...
    packageimg
  • Reddit_MapPorn_Europe及European主题热门地图分类数据2024_2025

    2026年1月7日 30 23 2

    数据集概述 本数据集包含2024年6月至2025年6月期间,Reddit平台r/MapPorn社区中标题含“Europe”或“European”的一百个热门地图数据,其中排除了重复及仅限欧盟或欧洲部分地区的地图。数据经手动编码确定地图表示类型,共一个文件。 文件详解 文件名称:Map Study Data 3.xlsx 文件格式:XLSX...
    packageimg
  • WSB_Based_GameStop事件Reddit社区评论支持倾向与行为意图标注完整数据集2021

    2026年1月3日 30 118 17

    数据集概述 本数据集为2021年GameStop事件高峰期Reddit...
    packageimg
  • Reddit政治用户多主题互动数据集2007_2022

    2025年12月18日 30 180 19

    数据集概述 本数据集包含2007-2022年Reddit政治子版块的用户互动数据,涵盖每周用户网络及消息数据库。网络中节点为用户,边为互动关系;消息库含主题、毒性、立场等属性,为研究政治话题互动提供支持。 文件详解 文件名称: message_data.zip 文件格式: ZIP压缩包 内容说明:...
    packageimg
  • Reddit帖子情感与股价变动关联数据集

    2025年12月13日 30 15 13

    数据集概述 本数据集聚焦Reddit金融社区帖子情感与股价短期变动的关联分析,涵盖苹果、特斯拉、亚马逊、微软、谷歌五家科技公司的Reddit帖子数据及对应股票价格数据,通过情感标注与相关性计算探索社交媒体对股价的潜在影响。 文件详解 数据文件:...
    packageimg
  • Reddit叙事中的道德判断数据集

    2025年12月13日 30 88 26

    数据集概述 该数据集聚焦Reddit平台叙事内容中的道德判断研究,通过社交常识与语言信号识别道德触发点。包含标注道德触发点的帖子实例数据,以及研究使用的事件聚类、语言特征参数等补充文档,为分析在线社区道德判断机制提供支持。 文件详解 post_instances.jsonl:JSON...
    packageimg
  • Reddit_Based_实体链接数据集_多标注文本语义分析完整数据

    2025年12月10日 30 76 14

    数据集概述 该数据集是基于社交媒体平台Reddit创建的实体链接数据集,包含六百一十九条帖子及一千二百四十三条对应评论,由三名人工标注者对文本分组进行标注,记录了提及-实体对及不同标注者间的一致性结果,含黄金、白银、青铜三种标注类型,总计一万一千一百零三条标注数据。 文件详解 文件名称: reddit_el.zip 文件格式: ZIP压缩包(.zip)...
    packageimg
  • Reddit群组互动对气候相关观点变化影响评估数据集2020_2022

    2025年12月9日 30 185 164

    数据集概述 该数据集收集了2020年7月至2022年12月期间,Reddit六个子版块的匿名对话网络数据,包含六千二百五十一篇帖子、三十六万三千三百五十条评论及五万四千九百二十三位独立用户,用于评估群组互动对气候相关观点变化的影响。 文件详解 文件名称: filtered_subs_and_threads_anonymized.zip 文件格式:...
    packageimg
  • Webis标题党破解语料库2022

    2025年12月9日 30 125 26

    数据集概述 该数据集包含从Facebook、Reddit和Twitter爬取的五千条标题党帖子及其对应的破解内容,按训练、验证、测试集划分。破解内容分为短语型、段落型和非连续多文本型三类,曾用于SemEval-2023标题党破解任务。 文件详解 文件名称: webis-clickbait-22.zip 文件格式: ZIP压缩包 内部文件(按预设划分):...
    packageimg
  • Reddit虚假新闻用户生成内容数据集2024

    2025年12月4日 30 2 0

    数据集概述 该数据集收集了2024年社交网络Reddit平台上的虚假新闻相关用户生成内容,包含3636名Reddit用户的相关数据。数据涵盖文本内容及可视化图表,支持对虚假新闻传播特征的分析,为虚假信息研究提供多维度数据基础。 文件详解 数据文件(共3个): Fake News.xlsx:Excel格式文件,存储虚假新闻相关结构化数据 Fake...
    packageimg
  • Reddit网络回声室检测案例研究数据集

    2025年12月4日 30 91 42

    数据集概述 该数据集为基于Reddit平台的回声室检测案例研究数据,包含网络数据压缩包与说明文档,支持验证“识别争议议题、推断用户意识形态、构建辩论网络、检测同质社区”四步框架,聚焦特朗普任期内三大社会政治议题的正反方回声室分析。 文件详解 网络数据压缩包:...
    packageimg
  • 自动化监考考试Reddit讨论数据集2015_2025

    2025年11月29日 30 82 9

    数据集概述 该数据集包含2015年1月至2025年6月期间,从Reddit相关子版块收集的2200多条关于自动化监考考试的讨论帖子,以及对应的分析代码文件,为研究在线考试作弊相关话题的用户讨论提供数据支持。 文件详解 数据文件 Cleaned Cheating...
    packageimg