-
Reddit_Comments_Dataset_文本风格迁移任务评论数据集
2026年1月21日 30 133 46
数据集概述 本数据集为文本风格迁移任务准备,包含Reddit评论及其正式语言翻译。数据来自20个Subreddits,通过GPT-2筛选高困惑度评论进行翻译,分为原始评论、带标签翻译及带风格示例的翻译文件,共5个文件,支持风格迁移模型训练与评估。 文件详解 reddit_comments.csv 文件格式:CSV...
-
SMOKING2025LMSU_YouTube_吸烟相关评论多维度分类数据
2026年1月21日 30 189 148
数据集概述 本数据集包含2024年3-8月从俄语YouTube吸烟主题热门视频收集的评论数据,通过情感、论点类型、作者性别和年龄等维度分类。数据涵盖16.5万条原始评论、5.8万条论点分类评论及5.5万条性别年龄分类评论,为吸烟相关社会讨论研究提供结构化数据支持。 文件详解 文件名称:Database SMOKING2025LMSU.xlsx...
-
Indonesia_E_voting_Sentiment_Based_X平台印尼电子投票系统评论情感分析数据
2025年12月29日 30 56 21
数据集概述 本数据集包含印尼网民在X平台上关于印尼电子投票系统的评论数据,涵盖原始评论、翻译后内容及情感标注信息,共4个文件,支持对电子投票相关舆情的情感分析研究。 文件详解 文件名称:Translated_sentiment.xlsx 文件格式:XLSX 字段映射介绍:包含翻译后的印尼电子投票相关评论内容及对应情感分析结果...
-
菲律宾南部摩洛身份与武装冲突多语言Facebook评论数据集2015_2017_2019
2025年12月19日 30 119 102
数据集概述 本数据集包含菲律宾十家报纸Facebook官方页面2015、2017及2019年的12,478条社交媒体评论,围绕摩洛身份、马马萨帕诺冲突、马拉维围城及BARMM建立等主题,可用于研究文本与报纸来源、地区及政治行政等变量的关系。 文件详解 数据文件:...
-
SURF应用评论摘要与软件变更推荐复制包
2025年12月11日 30 8 6
数据集概述 本数据集是研究论文《What Would Users Change in My App? Summarizing App Reviews for Recommending Software Changes》的复制包,包含两项实验的原始数据、结果文件、调查工具及SURF工具原型,支持复现基于应用评论摘要推荐软件变更的研究。 文件详解...



